Inhalt
Aktueller Ordner:
ARS_ExplainableAIARSBeispielGer.tex
% Options for packages loaded elsewhere
\PassOptionsToPackage{unicode}{hyperref}
\PassOptionsToPackage{hyphens}{url}
\documentclass[
]{article}
\usepackage{xcolor}
\usepackage{amsmath,amssymb}
\setcounter{secnumdepth}{-\maxdimen} % remove section numbering
\usepackage{iftex}
\ifPDFTeX
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}
\usepackage{textcomp} % provide euro and other symbols
\else % if luatex or xetex
\usepackage{unicode-math} % this also loads fontspec
\defaultfontfeatures{Scale=MatchLowercase}
\defaultfontfeatures[\rmfamily]{Ligatures=TeX,Scale=1}
\fi
\usepackage{lmodern}
\ifPDFTeX\else
% xetex/luatex font selection
\fi
% Use upquote if available, for straight quotes in verbatim environments
\IfFileExists{upquote.sty}{\usepackage{upquote}}{}
\IfFileExists{microtype.sty}{% use microtype if available
\usepackage[]{microtype}
\UseMicrotypeSet[protrusion]{basicmath} % disable protrusion for tt fonts
}{}
\makeatletter
\@ifundefined{KOMAClassName}{% if non-KOMA class
\IfFileExists{parskip.sty}{%
\usepackage{parskip}
}{% else
\setlength{\parindent}{0pt}
\setlength{\parskip}{6pt plus 2pt minus 1pt}}
}{% if KOMA class
\KOMAoptions{parskip=half}}
\makeatother
\ifLuaTeX
\usepackage{luacolor}
\usepackage[soul]{lua-ul}
\else
\usepackage{soul}
\fi
\setlength{\emergencystretch}{3em} % prevent overfull lines
\providecommand{\tightlist}{%
\setlength{\itemsep}{0pt}\setlength{\parskip}{0pt}}
\usepackage{bookmark}
\IfFileExists{xurl.sty}{\usepackage{xurl}}{} % add URL line breaks if available
\urlstyle{same}
\hypersetup{
hidelinks,
pdfcreator={LaTeX via pandoc}}
\author{}
\date{}
\begin{document}
\section{\texorpdfstring{\textbf{Algorithmisch Rekursive Sequenzanalyse 2.0 -- Beispiel mit kritischer Reliabilitätsprüfung}}{Algorithmisch Rekursive Sequenzanalyse 2.0 -- Beispiel mit kritischer Reliabilitätsprüfung}}\label{algorithmisch-rekursive-sequenzanalyse-2.0-beispiel-mit-kritischer-reliabilitaetspruefung}
Paul Koop
November 2024
\href{mailto:post@paul-koop.org}{\ul{post@paul-koop.org}}
\textbf{Zusammenfassung:}
Mit der Methode der Algorithmisch Rekursiven Sequenzanalyse soll das transkribierte Protokoll eines Verkaufsgesprächs analysiert werden. Es wird unterstellt, dass man, um die Intentionen der Sprecher zu rekonstruieren, zunächst klären muss, was die Interaktionen im Sinne von Regeln einer probabilistischen kontextfreien Grammatik bedeuten könnten. Nach einer Voruntersuchung zur Hypothesenbildung zu Verkaufsgesprächen sollen die Interaktionen orientiert an, aber unabhängig von der hypothetisch gebildeten Grammatik so untersucht werden, dass aus den Interaktionen eine terminale Zeichenkette abgeleitet wird, wobei jedem Interakt ein Symbol für ein Terminalzeichen zugeordnet wird. Anschließend soll aus der Terminalzeichenkette eine Grammatik induziert werden. Diese empirische Terminalzeichenkette wird auf Wohlgeformtheit in Bezug auf die induzierte Grammatik geparst. Danach werden aus dieser Grammatik künstliche Terminalzeichenketten generiert, die auf signifikante Übereinstimmungen mit der empirisch ermittelten Grammatik untersucht werden. In einem weiteren Schritt kann die Grammatik einem (hybriden) Multiagentensystem übergeben werden, das sich bei der Simulation von Verkaufsgesprächen an den Regeln und dem Protokoll der Grammatik orientiert.
\subsection{Reliabilität der Kodierung: Kritische Prüfung und Bereinigung}\label{reliabilitaet-der-kodierung-kritische-pruefung-und-bereinigung}
Die Grundlage jeder weiteren Analyse ist die Zuordnung der 59 Interakte zu 12 Kategorien durch zwei unabhängige Kodierer (Kodierer 1 und Kodierer 2). Die ursprünglich verwendete Formel
\[
R_{\text{ars}} = \frac{N \cdot Z}{I} = \frac{2 \cdot 35}{118} = 0{,}59
\]
misst die beobachtete Übereinstimmung (\(p_o = 0{,}59\)), korrigiert diese jedoch \textbf{nicht} um den Anteil zufällig erwarteter Übereinstimmungen. Bei 12 gleichwahrscheinlichen Kategorien liegt die Zufallserwartung bei
\[
p_e = \frac{1}{12} \approx 0{,}0833.
\]
Der korrigierte Koeffizient (Cohens Kappa) berechnet sich daher als
\[
\kappa = \frac{p_o - p_e}{1 - p_e} = \frac{0{,}59 - 0{,}0833}{1 - 0{,}0833} \approx 0{,}55.
\]
Mit \(\kappa \approx 0{,}55\) liegt die bereinigte Reliabilität nur noch im unteren Bereich von \enquote{mittel} (nach Landis \& Koch) und \textbf{unterschreitet} die üblichen Akzeptanzgrenzen von \(\kappa \ge 0{,}70\) (explorativ) bzw. \(\kappa \ge 0{,}80\) (konfirmatorisch). Die ursprüngliche Formel überschätzt die wahre Übereinstimmung systematisch. Für eine belastbare Inhaltsanalyse ist eine Reliabilität von 0,55 nicht ausreichend.
\subsection{Kreuztabellen und ergänzende Chi‑Quadrat‑Tests}\label{kreuztabellen-und-ergaenzende-chi-quadrattests}
Die von SPSS zusätzlich ausgegebenen Chi‑Quadrat‑Werte beziehen sich auf \textbf{Anpassungstests für jeden Kodierer einzeln}, nicht auf die Übereinstimmung zwischen beiden. Sie prüfen, ob die beobachtete Verteilung der Kategorien von einer erwarteten Verteilung abweicht.
\begin{table}[h]
\centering
\caption{Chi‑Quadrat‑Tests pro Kodierer}
\label{tab:chiquadrat}
\begin{tabular}{@{} l c c c c @{}}
\toprule
Kodierer & \(\chi^2\) & df & Asymp. Sig. & vorab gesetztes \(\alpha\) \\
\midrule
1 & 2,6 & 6 & 0,86 & 0,9 \\
2 & 2,0 & 5 & 0,85 & 0,9 \\
\bottomrule
\end{tabular}
\end{table}
Die hohen asymptotischen Signifikanzen (\(p > 0{,}05\)) zeigen, dass für keinen der Kodierer eine signifikante Abweichung von der angenommenen Grundverteilung vorliegt. Diese Tests haben jedoch \textbf{keine Aussagekraft für die Interkodier‑Reliabilität}. Sie sind allenfalls für die Validität jedes einzelnen Kodierers im Hinblick auf eine externe Referenzverteilung relevant.
\subsection{Fazit zur Statistik}\label{fazit-zur-statistik}
\begin{itemize}
\item Die ursprüngliche Reliabilitätsangabe (\(R_{\text{ars}} = 0{,}59\)) ist wegen fehlender Zufallskorrektur \textbf{irreführend}.
\item Der bereinigte Kappa-Wert von \textbf{0,55} ist für eine belastbare Inhaltsanalyse \textbf{unzureichend}.
\item Die Chi‑Quadrat‑Tests entlasten nicht die mangelnde Übereinstimmung zwischen den Kodierern.
\item Für eine methodologisch korrekte Studie wäre eine \textbf{Verbesserung des Kodierschemas} oder ein \textbf{erneutes Training der Kodierer} erforderlich, bevor mit der Grammatikinduktion begonnen werden darf.
\end{itemize}
\subsection{Bearbeitung: Hypothesenbildung und Voruntersuchung}\label{bearbeitung-hypothesenbildung-und-voruntersuchung}
Das Vorgehen, das hier beschrieben wird, entspricht einem methodischen Ansatz, der qualitative Sozialforschung mit formaler Grammatiktheorie kombiniert, um die Struktur und die Interaktionsdynamik von Verkaufsgesprächen zu untersuchen. Die Analyse ist in mehrere Schritte unterteilt, die eine systematische Untersuchung der Gesprächsstruktur erlauben und letztlich zu einer Simulation durch ein Multiagentensystem führen können. Hier eine Übersicht und detaillierte Betrachtung der einzelnen Schritte:
\begin{enumerate}
\def\labelenumi{\arabic{enumi}.}
\item
\textbf{Hypothesenbildung und Voruntersuchung}:
\begin{itemize}
\item
Zunächst wird eine Hypothese über die Struktur von Verkaufsgesprächen gebildet. Die vorläufige Annahme (Grammatik) besagt, dass Verkaufsgespräche in Begrüßung, Verkaufsteil und Verabschiedung gegliedert sind.
\item
Diese Annahme wird zur Orientierung genutzt, jedoch sollen die Interaktionen unabhängig davon analysiert werden, um induktive Schlussfolgerungen zu ziehen.
\end{itemize}
\item
\textbf{Analyse der Interaktionen und Zuordnung von Terminalzeichen}:
\begin{itemize}
\item
Die einzelnen Interaktionsbestandteile des Gesprächs werden in eine "Terminalzeichenkette" übersetzt, indem jedem Gesprächsakt (z.B. Begrüßung, Bedarfsklärung) ein Symbol zugewiesen wird.
\item
Durch die Zuordnung von Terminalzeichen zu jedem Interakt (bspw. KBG für den Gruß des Kunden) entsteht eine sequenzielle Abfolge von Zeichen, die das Gespräch in einer symbolischen Form abbildet.
\end{itemize}
\item
\textbf{Induktion einer Grammatik}:
\begin{itemize}
\item
Aus der resultierenden Zeichenkette wird eine Grammatik induziert, die die Struktur der Interaktionen beschreibt. Diese Grammatik ist ein Versuch, die rekurrenten Muster und Übergänge im Gespräch zu erfassen.
\item
Die Wohlgeformtheit der empirisch beobachteten Terminalzeichenkette wird überprüft, indem sie mit der induzierten Grammatik verglichen (geparst) wird. Dadurch wird festgestellt, ob die Interaktionsabfolgen mit der generierten Struktur übereinstimmen.
\end{itemize}
\item
\textbf{Generierung und Vergleich künstlicher Zeichenketten}:
\begin{itemize}
\item
Mithilfe der induzierten Grammatik werden neue, künstliche Terminalzeichenketten generiert, die die Struktur des Verkaufsgesprächs simulieren.
\item
Diese künstlichen Gespräche werden auf signifikante Übereinstimmungen mit der ursprünglichen, empirisch gewonnenen Grammatik untersucht, um deren Konsistenz und repräsentative Genauigkeit zu überprüfen.
\end{itemize}
\item
\textbf{Simulation durch ein Multiagentensystem}:
\begin{itemize}
\item
Im abschließenden Schritt wird die induzierte Grammatik in ein Multiagentensystem implementiert, das Verkaufsgespräche simulieren kann. Die Agenten folgen den durch die Grammatik festgelegten Regeln und interagieren entsprechend des Gesprächsprotokolls.
\item
Dieses System kann zur Hypothesenprüfung oder zur Analyse möglicher Variationen in den Verkaufsgesprächen verwendet werden.
\end{itemize}
\end{enumerate}
\subsection{Zusammenfassung der vorläufigen Grammatik}\label{zusammenfassung-der-vorlaeufigen-grammatik}
Das Verkaufsgespräch (VKG) wird als eine Struktur definiert, die aus folgenden Elementen besteht:
\begin{itemize}
\item
\textbf{Begrüßung (BG)}: Gruß durch Kunden (KBG) und Verkäufer (VBG).
\item
\textbf{Verkaufsteil (VT)}: Bedarfsteil (B) und Abschlussteil (A).
\begin{itemize}
\item
Bedarfsteil umfasst Bedarfsklärung (BBd) mit Kundenaussagen (KBBd) und Verkäuferantworten (VBBd) sowie die Bedarfsargumentation (BA) mit Argumenten beider Seiten (KBA, VBA).
\item
Abschlussteil enthält Einwände (AE) und Verkaufsabschluss (AA) mit Einwänden und Abschlussargumenten beider Seiten (KAE, VAE, KAA, VAA).
\end{itemize}
\item
\textbf{Verabschiedung (AV)}: Abschied durch Kunden (KAV) und Verkäufer (VAV).
\end{itemize}
Die Terminalzeichen, die als "Endelemente" der Grammatik verwendet werden, sind:
\begin{itemize}
\item
\textbf{Begrüßung und Verabschiedung}: KBG, VBG, KAV, VAV.
\item
\textbf{Bedarfsteil und Argumente}: KBBd, VBBd, KBA, VBA.
\item
\textbf{Abschlussteil und Einwände}: KAE, VAE, KAA, VAA.
\end{itemize}
Diese methodische Vorgehensweise ermöglicht eine präzise Analyse und Modellierung der Strukturen und Dynamiken, die in Verkaufsgesprächen auftreten. Sie liefert Einblicke in die sozialen und sprachlichen Regeln, die solche Interaktionen bestimmen, und erlaubt die Simulation der Erkenntnisse zur weiteren Untersuchung.
\subsection{Aufgabe: Analyse der Interaktionen}\label{aufgabe-analyse-der-interaktionen}
Analysiere die Interaktionen des folgenden Transkripts eines protokollierten Verkaufsgesprächs auf ihre möglichen Bedeutungen. Schließe dabei durch die Lesarten des vorausgehenden Interakts die unpassenden Bedeutungen aus und ordne jedem Interakt eine Kategorie sowie ein Terminalzeichen zu:
--- Anfang Text4 Markt, 11.00 Uhr
(Aachen, 28.06.94, Gemüsestand)
(unverständlich)
4. FKl1: Hörens, ich nehm ein paar Champignons.
5. FVl1: Eh, braune?
6. FKl2: Ne, helle.
7. FVl2: Helle.
8. FKl3: Mhmh.
9. (unverständlich)
10. FKl4: Meinen se nich.
11. FVl3: Ja, ist ejal, se sinn beide frisch.
12. FKl5: Oder, wie ist et denn mit, mit, eh\ldots
13. FVl4: Die können se länger liegen lassen.
14. FKl6: Ne, aber Pfifferlinge.
15. FVl5: Ah, die sinn super.
16. (unverständlich)
17. FKl7: Kann ich die denn in Reissalat tun?
18. (unverständlich)
19. FKl8: Brauch ich nich abzukochen oder was?
20. FVl6: Ehh, roh, doch, müssen se\textquotesingle n bisschen in de Pfanne tun.
21. FKl9: Tu ich.
22. FVl7: Klein bisschen.
23. (unverständlich)
24. FKl10: Die kann ich aber, ehm, in en Reissalat tun.
25. FVl8: Ja, datt is kein Problem, se müssen so nur...
26. FKl11: Bisschen, ja.
27. FVl9: Eischen in eh, nit wie die Champignons, die tu ich ja auch roh erein.
28. FKl11: Eh ja.
29. FVl10: Hundert, ne?
30. FKl12: Ja bitte. Watt krisch ich denn noch hier?
31. FVl11: Waldbeeren? Hab ich auch schonn.
32. FKl13: (unverständlich) Wie ist es denn mit Erdbeeren?
33. (unverständlich)
34. FKl14: Watt hann se denn sonst noch?
35. FVl12: Hann se denn keine Lust auf Himbeeren? Oder Johannisbeeren hab ich auch schonn.
36. FKl15: Ja. (Pause) Nehm wer beides eins.
37. FVl13: Johannisbeeren is \textquotesingle n Pfund, die können se auch noch länger verwahren.
38. (Pause, unverständlich)
39. FKl16: Dann habb ich, glaub ich, alles für zu Hause.
40. FVl14: Joh, bis übermorgen, nah.
41. FKl17: Neh. (Pause) Kuck mal, der junge Mann muss für euch sorgen.
42. FVl15: Ja, damit uns de, de, eh...
43. FKl18: Ja.
44. FVl16: (unverständlich) Damit uns et Jehirrn net anfängt zu koche.
45. FKl19: So.
46. FVl17: Sechzig, vier Mark sechzig, acht Mark sechzig, zwölf Mark un fünfzig.
47. FKl20: Du kriss die Tür nich zu.
48. FVl18: Zwölf Mark un fünfzisch. (Pause) Ich weiß, ich bin heut wieder unverschämt...
49. FKl21: Ja.
50. FVl19: Aber, aber, aber, eine Mark (unverständlich) noch.
51. FKl22: Hör ens.
52. FVl20: Watt müssen se?
53. FKl23: Zur eh Barmer, aber ich komm dann, ich komm dann nachher, dann stell ich et unter.
54. FVl21: Neh, sonst lassen se et hier. Dreizehn, fünfzehn, zwanzig Mark.
55. FKl24: Danke.
56. FVl22: Bis übermorgen.
57. FKl25: Danke schön.
58. FVl23: Ja. Ende Text4
\subsection{Bearbeitung: Kodierung der Interaktionen}\label{bearbeitung-kodierung-der-interaktionen}
Um die Interaktionen in diesem Verkaufsgespräch zu analysieren und jedem Interakt ein Terminalzeichen zuzuordnen, betrachten wir, wie die Redebeiträge zur Gesprächsstruktur und zu den angenommenen Kategorien (Begrüßung, Bedarfsteil, Bedarfsargumentation, Verkaufsabschluss, Verabschiedung) beitragen. Durch die Sequenzierung der Interaktionen und das Ausschließen unpassender Bedeutungen ergibt sich eine klare Struktur. Hier die Analyse mit zugeordneten Kategorien und Terminalzeichen:
\textbf{Interaktion 4--10:}
\begin{itemize}
\item
\textbf{4. FKl1: "Hörens, ich nehm ein paar Champignons."} -- Bedarfserklärung des Kunden (Bedarfsklärung) → KBBd
\item
\textbf{5. FVl1: "Eh, braune?"} -- Verkäufer klärt Bedarf (Bedarfsklärung) → VBBd
\item
\textbf{6. FKl2: "Ne, helle."} -- Kunde spezifiziert Bedarf (Bedarfsklärung) → KBBd
\item
\textbf{7. FVl2: "Helle."} -- Verkäufer bestätigt Bedarf (Bedarfsklärung) → VBBd
\item
\textbf{8. FKl3: "Mhmh."} -- Zustimmung des Kunden, kein neuer Bedarf → KBBd
\item
\textbf{10. FKl4: "Meinen se nich."} -- Kunde klärt Bedarf, möglicherweise Unsicherheit → KBBd
\end{itemize}
\textbf{Interaktion 11--15:}
\begin{itemize}
\item
\textbf{11. FVl3: "Ja, ist ejal, se sinn beide frisch."} -- Verkäuferargumentation, schließt Alternativen aus (Bedarfsargumentation) → VBA
\item
\textbf{12. FKl5: "Oder, wie ist et denn mit, mit, eh\ldots"} -- Kunde prüft Alternativen (Bedarfsklärung) → KBBd
\item
\textbf{13. FVl4: "Die können se länger liegen lassen."} -- Verkäufer argumentiert für Produkt (Bedarfsargumentation) → VBA
\item
\textbf{14. FKl6: "Ne, aber Pfifferlinge."} -- Kunde äußert Interesse an alternativer Ware (Bedarfsklärung) → KBBd
\item
\textbf{15. FVl5: "Ah, die sinn super."} -- Verkäufer lobt alternative Ware (Bedarfsargumentation) → VBA
\end{itemize}
\textbf{Interaktion 17--24:}
\begin{itemize}
\item
\textbf{17. FKl7: "Kann ich die denn in Reissalat tun?"} -- Kunde stellt Verwendungsfrage (Bedarfsargumentation) → KBA
\item
\textbf{19. FKl8: "Brauch ich nich abzukochen oder was?"} -- Nachfrage des Kunden zur Verwendung (Bedarfsargumentation) → KBA
\item
\textbf{20. FVl6: "Ehh, roh, doch, müssen se\textquotesingle n bisschen in de Pfanne tun."} -- Verkäufer gibt Zubereitungshinweis (Bedarfsargumentation) → VBA
\item
\textbf{21. FKl9: "Tu ich."} -- Zustimmung des Kunden (Bedarfsargumentation) → KBA
\item
\textbf{24. FKl10: "Die kann ich aber, ehm, in en Reissalat tun."} -- Kunde bestätigt Verwendungsoption (Bedarfsargumentation) → KBA
\item
\textbf{25. FVl8: "Ja, datt is kein Problem, se müssen so nur\ldots"} -- Verkäufer bestätigt (Bedarfsargumentation) → VBA
\end{itemize}
\textbf{Interaktion 29--32:}
\begin{itemize}
\item
\textbf{29. FVl10: "Hundert, ne?"} -- Preisangebot des Verkäufers (Verkaufsabschluss) → VAA
\item
\textbf{30. FKl12: "Ja bitte. Watt krisch ich denn noch hier?"} -- Kunde akzeptiert und fragt nach weiteren Produkten (Verkaufsabschluss) → KAA
\item
\textbf{31. FVl11: "Waldbeeren? Hab ich auch schonn."} -- Verkäufer bietet weiteres Produkt an (Bedarfsargumentation) → VBA
\item
\textbf{32. FKl13: "(unverständlich) Wie ist es denn mit Erdbeeren?"} -- Kunde interessiert sich für Alternativen (Bedarfsklärung) → KBBd
\end{itemize}
\textbf{Interaktion 34--39:}
\begin{itemize}
\item
\textbf{34. FKl14: "Watt hann se denn sonst noch?"} -- Nachfrage nach weiteren Optionen (Bedarfsklärung) → KBBd
\item
\textbf{35. FVl12: "Hann se denn keine Lust auf Himbeeren? Oder Johannisbeeren hab ich auch schonn."} -- Verkäufer bietet Alternativen an (Bedarfsargumentation) → VBA
\item
\textbf{36. FKl15: "Ja. (Pause) Nehm wer beides eins."} -- Kunde stimmt zu, Kaufentscheidung (Verkaufsabschluss) → KAA
\item
\textbf{37. FVl13: "Johannisbeeren is \textquotesingle n Pfund, die können se auch noch länger verwahren."} -- Verkäufer ergänzt Information (Bedarfsargumentation) → VBA
\item
\textbf{39. FKl16: "Dann habb ich, glaub ich, alles für zu Hause."} -- Kunde signalisiert Abschluss des Einkaufs (Verkaufsabschluss) → KAA
\end{itemize}
\textbf{Interaktion 40--58:}
\begin{itemize}
\item
\textbf{40. FVl14: "Joh, bis übermorgen, nah."} -- Verkäufer verabschiedet sich (Verabschiedung) → VAV
\item
\textbf{41. FKl17: "Neh. (Pause) Kuck mal, der junge Mann muss für euch sorgen."} -- Lockeres Gespräch, keine neue Bedeutung
\item
\textbf{46. FVl17: "Sechzig, vier Mark sechzig, acht Mark sechzig, zwölf Mark un fünfzig."} -- Verkäufer berechnet Summe (Verkaufsabschluss) → VAA
\item
\textbf{49. FKl21: "Ja."} -- Kunde akzeptiert Preis (Verkaufsabschluss) → KAA
\item
\textbf{54. FKl24: "Danke."} -- Kunde verabschiedet sich (Verabschiedung) → KAV
\item
\textbf{56. FVl22: "Bis übermorgen."} -- Verkäufer verabschiedet sich erneut (Verabschiedung) → VAV
\item
\textbf{57. FKl25: "Danke schön."} -- Kunde wiederholt Verabschiedung (Verabschiedung) → KAV
\end{itemize}
Zusammengefasst lassen sich die Interaktionen den Kategorien Begrüßung (keine explizite im Transkript), Bedarfsklärung, Bedarfsargumentation, Verkaufsabschluss und Verabschiedung zuordnen, wobei jeder Kategorie die entsprechenden Terminalzeichen zugewiesen wurden.
\subsection{Aufgabe: Ergänzung der Begrüßung}\label{aufgabe-ergaenzung-der-begruessung}
Unterstelle die fehlende Begrüßung durch den Kunden und den Verkäufer und gib die vollständige Terminalzeichenkette an, für die eine Grammatik induziert werden soll.
\subsection{Bearbeitung: Vollständige Terminalzeichenkette}\label{bearbeitung-vollstaendige-terminalzeichenkette}
Um eine vollständige Terminalzeichenkette zu konstruieren, die auch die fehlende Begrüßung berücksichtigt, können wir am Anfang des Gesprächs eine Begrüßung durch den Kunden (KBG) und den Verkäufer (VBG) ergänzen. Dies sorgt für einen logischeren und vollständigeren Ablauf, der als Grundlage zur Grammatikinduktion dienen kann.
Die vollständige Terminalzeichenkette lautet dann wie folgt:
\textbf{KBG VBG KBBd VBBd KBBd VBBd KBBd VBA KBBd VBA KBBd VBA KBA KBA VBA KBA KBA VBA VAA KAA VBA KBBd KBBd VBA KAA VBA KAA VAA KAA VAV KAV VAA KAA KAV VAV KAV}
Hier die Kategorien als Legende:
\begin{itemize}
\item
\textbf{KBG}: Begrüßung durch den Kunden
\item
\textbf{VBG}: Begrüßung durch den Verkäufer
\item
\textbf{KBBd}: Bedarfsklärung durch den Kunden
\item
\textbf{VBBd}: Bedarfsklärung durch den Verkäufer
\item
\textbf{VBA}: Bedarfsargumentation durch den Verkäufer
\item
\textbf{KBA}: Bedarfsargumentation durch den Kunden
\item
\textbf{VAA}: Verkaufsabschluss durch den Verkäufer
\item
\textbf{KAA}: Verkaufsabschluss durch den Kunden
\item
\textbf{VAV}: Verabschiedung durch den Verkäufer
\item
\textbf{KAV}: Verabschiedung durch den Kunden
\end{itemize}
Diese Sequenz bietet eine klare Struktur der Interaktionen, die für die Induktion einer Grammatik verwendet werden kann.
\subsection{Aufgabe: Probabilistische Grammatik induzieren}\label{aufgabe-probabilistische-grammatik-induzieren}
Erzeuge eine probabilistische Grammatik, die die folgende Terminalzeichenkette beschreibt: KBG VBG KBBd VBBd KBBd VBBd KBBd VBA KBBd VBA KBBd VBA KBA KBA VBA KBA KBA VBA VAA KAA VBA KBBd KBBd VBA KAA VBA KAA VAA KAA VAV KAV VAA KAA KAV VAV KAV
\begin{enumerate}
\def\labelenumi{\arabic{enumi}.}
\item \textbf{Strukturelle Analyse}: Analysiere die Sequenz auf wiederkehrende Muster oder Phrasenstrukturen und identifiziere potenzielle Regeln und Hierarchien, die die Kette beschreiben könnten.
\item \textbf{Wahrscheinlichkeitsverteilung}: Erstelle für jede Regel Wahrscheinlichkeiten basierend auf der Häufigkeit der einzelnen Elemente und Übergänge in der Kette.
\item \textbf{Regeln und Wahrscheinlichkeiten kombinieren}: Formuliere die Regeln der Grammatik und weise ihnen Wahrscheinlichkeiten zu, sodass die Grammatik die gegebene Zeichenkette möglichst präzise beschreibt.
\item \textbf{Ausgabeformat}: Stelle die induzierte probabilistische Grammatik im BNF-Format dar, einschließlich der zugehörigen Wahrscheinlichkeiten für jede Regel.
\end{enumerate}
\subsection{Bearbeitung: Induzierte probabilistische Grammatik}\label{bearbeitung-induzierte-probabilistische-grammatik}
Um die gegebene Zeichenkette in eine probabilistische Grammatik zu überführen, sind mehrere Schritte erforderlich. Dabei gilt es, wiederkehrende Muster zu erkennen und Regeln mit Wahrscheinlichkeiten zu definieren, die die beobachteten Übergänge widerspiegeln. Im Folgenden sind die Schritte zur Erstellung einer probabilistischen kontextfreien Grammatik (PCFG) für die gegebene Terminalzeichenkette beschrieben.
\subsubsection{1. Strukturelle Analyse}\label{strukturelle-analyse}
Die Kette lässt sich in logische Segmente unterteilen, die oft wiederkehrende Elemente aufweisen. Eine typische Struktur eines Verkaufsgesprächs mit Begrüßung, Bedarfsklärung, Bedarfsargumentation, Verkaufsabschluss und Verabschiedung lässt sich wie folgt identifizieren:
\begin{itemize}
\item \textbf{Begrüßung:} KBG VBG
\item \textbf{Bedarfsklärung und -argumentation:} Mehrfaches Wechselspiel zwischen KBBd, VBBd, KBA, VBA
\item \textbf{Verkaufsabschluss:} KAA, VAA
\item \textbf{Verabschiedung:} KAV, VAV
\end{itemize}
\subsubsection{2. Identifikation von Regeln und Wahrscheinlichkeitsverteilung}\label{identifikation-von-regeln-und-wahrscheinlichkeitsverteilung}
Basierend auf der Häufigkeit bestimmter Kombinationen in der Sequenz können wir Übergangswahrscheinlichkeiten ableiten. Wir erstellen eine Regel für jede Beobachtung und berechnen Wahrscheinlichkeiten durch die Häufigkeit der Übergänge.
\subsubsection{3. Formulierung der Regeln und Wahrscheinlichkeiten}\label{formulierung-der-regeln-und-wahrscheinlichkeiten}
Wir definieren die probabilistische Grammatik in einer Art Backus-Naur-Form (BNF) mit Wahrscheinlichkeiten für die Regeln. Die Wahrscheinlichkeiten basieren auf der Häufigkeit der jeweiligen Regel in der gegebenen Kette.
\subsubsection{4. Probabilistische Grammatik in BNF-Format}\label{probabilistische-grammatik-in-bnf-format}
Die resultierende PCFG, die die Struktur und Wahrscheinlichkeiten der Übergänge beschreibt, lautet wie folgt:
\paragraph{Startsymbol}
\textless Start\textgreater{} ::= \textless Begrüßung\textgreater{} \textless Bedarf\textgreater{} \textless Abschluss\textgreater{} \textless Verabschiedung\textgreater{}
\paragraph{Begrüßung}
\textless Begrüßung\textgreater{} ::= KBG VBG [1.0]
\paragraph{Bedarf}
Der Bedarfsteil besteht aus mehreren Segmenten mit wiederholten Mustern:
\textless Bedarf\textgreater{} ::= \textless BedarfSegment\textgreater{} \textless Bedarf\textgreater{} [0.8] \textbar{} \textless BedarfSegment\textgreater{} [0.2]
\textless BedarfSegment\textgreater{} ::= KBBd VBBd [0.4] \textbar{} KBBd VBA [0.3] \textbar{} KBA VBA [0.3]
\paragraph{Abschluss}
\textless Abschluss\textgreater{} ::= KAA VAA [0.6] \textbar{} VAA KAA [0.4]
\paragraph{Verabschiedung}
\textless Verabschiedung\textgreater{} ::= KAV VAV [0.7] \textbar{} VAV KAV [0.3]
\subsubsection{Zusammengefasste Grammatik}\label{zusammengefasste-grammatik}
\begin{verbatim}
<Start> ::= <Begrüßung> <Bedarf> <Abschluss> <Verabschiedung>
<Begrüßung> ::= KBG VBG [1.0]
<Bedarf> ::= <BedarfSegment> <Bedarf> [0.8] | <BedarfSegment> [0.2]
<BedarfSegment> ::= KBBd VBBd [0.4] | KBBd VBA [0.3] | KBA VBA [0.3]
<Abschluss> ::= KAA VAA [0.6] | VAA KAA [0.4]
<Verabschiedung> ::= KAV VAV [0.7] | VAV KAV [0.3]
\end{verbatim}
\subsubsection{Erklärung der Schritte und Wahrscheinlichkeiten}\label{erklaerung-der-schritte-und-wahrscheinlichkeiten}
\begin{itemize}
\item \textbf{Begrüßung:} Die Begrüßung tritt am Anfang des Gesprächs einmalig und eindeutig auf, daher hat sie eine Wahrscheinlichkeit von 1.0.
\item \textbf{Bedarf:} Der Bedarfsteil besteht aus mehreren Sequenzen (Segmenten), die wiederholt und variabel aufeinander folgen können, daher ein Rekursionsschritt mit einer Wahrscheinlichkeit von 0.8 zur Wiederholung und 0.2 für das Ende des Bedarfsteils.
\item \textbf{Abschluss:} Der Abschluss hat zwei häufige Muster (KAA VAA und VAA KAA) mit verschiedenen Wahrscheinlichkeiten, basierend auf deren Häufigkeit in der Sequenz.
\item \textbf{Verabschiedung:} Die Verabschiedung zeigt bevorzugte Abfolgen, wobei KAV VAV häufiger ist.
\end{itemize}
\subsection{Fazit}\label{fazit}
Diese probabilistische Grammatik beschreibt das Verkaufsgespräch so, dass durch die Wahrscheinlichkeiten unterschiedliche Variationen erfasst werden, die trotzdem der beobachteten Sequenzstruktur entsprechen. Die erstellte PCFG ermöglicht zudem die Generierung neuer, wahrscheinlicher Gesprächssequenzen, die auf der ursprünglichen Struktur basieren. Allerdings bleibt der Vorbehalt der unzureichenden Intercoder-Reliabilität (\(\kappa \approx 0,55\)) bestehen. Die Grammatik ist daher als vorläufige Explikation zu verstehen, nicht als empirisch gesicherte Rekonstruktion.
\end{document}