flreader – Dateibrowser

Inhalt

Aktueller Ordner: ARS_ExplainableAI
⬅ Übergeordnet
ARS_EIRA.tex

```latex
\documentclass[12pt,a4paper]{article}
\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
\usepackage{lmodern}
\usepackage{amsmath,amssymb}
\usepackage{graphicx}
\usepackage{xcolor}
\usepackage{hyperref}
\usepackage{geometry}
\geometry{a4paper, left=3cm, right=3cm, top=3cm, bottom=3cm}
\usepackage{setspace}
\onehalfspacing
\usepackage{parskip}
\usepackage[ngerman]{babel}
\usepackage{csquotes}
\usepackage{microtype}
\usepackage{booktabs}
\usepackage{longtable}
\usepackage{array}
\usepackage{listings}
\usepackage{xcolor}
\usepackage{caption}
\usepackage{subcaption}
\usepackage{float}
\usepackage{url}
\usepackage{natbib}
\usepackage{titling}

\lstset{
  language=Python,
  basicstyle=\ttfamily\small,
  keywordstyle=\color{blue},
  commentstyle=\color{green!40!black},
  stringstyle=\color{red},
  showstringspaces=false,
  numbers=left,
  numberstyle=\tiny,
  numbersep=5pt,
  breaklines=true,
  frame=single,
  backgroundcolor=\color{gray!5},
  tabsize=2,
  captionpos=b
}

\title{\Huge\textbf{Erklärbar Rekursive Interaktionsanalyse (ERIA)} \\
       \LARGE Integration qualitativer Sequenzanalyse mit\\
       \LARGE formaler Modellierung durch Petri-Netze, Bayessche Verfahren\\
       \LARGE und computerlinguistische Methoden}

\author{
  \large
  \begin{tabular}{c}
    Paul Koop
  \end{tabular}
}

\date{\large 2026}

\begin{document}

\maketitle

\begin{abstract}
Die qualitative Sozialforschung steht vor der Herausforderung, die methodologische 
Kontrolle interpretativer Verfahren mit der Präzision formaler Modellierung zu 
verbinden. Der vorliegende Beitrag entwickelt die \textbf{Erklärbar Rekursive 
Interaktionsanalyse (ERIA)} als integrative Methodologie, die auf den Stärken 
bestehender Ansätze aufbaut: der hierarchischen Grammatikinduktion der ARS 3.0, 
der Prozessmodellierung durch Petri-Netze (ARS 4.0), der probabilistischen Modellierung 
durch Bayessche Verfahren sowie der komplementären Nutzung computerlinguistischer 
Methoden. Anders als rein automatisierte Verfahren wahrt die ERIA die methodologische 
Kontrolle, indem alle formalen Modelle auf interpretativ gewonnene Kategorien 
zurückgeführt werden. Zugleich überwindet sie die sequenzielle Beschränkung 
traditioneller Ansätze durch die Modellierung von Nebenläufigkeit, Ressourcen und 
Unsicherheit. Die Anwendung auf acht Transkripte von Marktgesprächen demonstriert 
die Leistungsfähigkeit der integrativen Methodologie. Das Verfahren wird als 
\textbf{ERIA 1.0} bezeichnet.
\end{abstract}

\newpage
\tableofcontents
\newpage

\section{Einleitung: Drei methodologische Traditionen und ihre Synthese}

Die Analyse natürlicher Interaktionen ist seit jeher Gegenstand dreier methodologischer 
Traditionen, die weitgehend unverbunden nebeneinander existieren:

\begin{enumerate}
    \item \textbf{Die qualitative Sequenzanalyse} (objektive Hermeneutik, 
    Konversationsanalyse) erschließt die latente Sinnstruktur von Interaktionen 
    durch kontrollierte Interpretation. Ihre Stärke ist die Tiefe des Verstehens; 
    ihre Schwäche ist die begrenzte Skalierbarkeit und Formalisierbarkeit.
    
    \item \textbf{Die formale Prozessmodellierung} (Petri-Netze, Prozesskalküle) 
    erlaubt die exakte Modellierung von Nebenläufigkeit, Ressourcen und Zustandsübergängen. 
    Ihre Stärke ist die Präzision und Analysierbarkeit; ihre Schwäche ist die 
    mangelnde Anbindung an qualitative Sinnkategorien.
    
    \item \textbf{Die computerlinguistische Modellierung} (Hidden-Markov-Modelle, 
    Transformer, CRF) ermöglicht die statistische Analyse großer Textkorpora. 
    Ihre Stärke ist die Skalierbarkeit; ihre Schwäche ist die Opazität und die 
    fehlende hermeneutische Fundierung.
\end{enumerate}

Die jüngere Entwicklung der \textbf{Algorithmisch Rekursiven Sequenzanalyse (ARS)} 
hat erste Brücken zwischen diesen Traditionen geschlagen. Die ARS 3.0 führte eine 
hierarchische Grammatikinduktion ein, die interpretativ gewonnene Terminalzeichen 
in Nonterminale überführt. Die ARS 4.0 erweiterte das Spektrum um Petri-Netze 
(Nebenläufigkeit, Ressourcen) und Bayessche Verfahren (Unsicherheit, latente 
Variablen). Zudem wurden hybride Integrationen computerlinguistischer Methoden 
(CRF, Transformer-Embeddings, Graph Neural Networks, Attention) als komplementäre 
Erweiterungen entwickelt.

Der vorliegende Beitrag integriert diese Stränge zu einer kohärenten Methodologie, 
der \textbf{Erklärbar Rekursiven Interaktionsanalyse (ERIA)}. Die ERIA wahrt die 
methodologische Kontrolle durch die Rückbindung aller formalen Modelle an 
interpretativ gewonnene Kategorien. Sie erweitert diese Kontrolle jedoch durch 
formale Präzision, Analysierbarkeit und Skalierbarkeit.

\section{Methodologische Grundprinzipien der ERIA}

Die ERIA basiert auf fünf methodologischen Grundprinzipien:

\begin{enumerate}
    \item \textbf{Primat der Interpretation}: Alle formalen Modelle werden aus 
    interpretativ gewonnenen Kategorien abgeleitet, nicht automatisch induziert.
    
    \item \textbf{Mehrebenen-Integration}: Sequenzielle Struktur (PCFG), 
    Nebenläufigkeit (Petri-Netze), Unsicherheit (Bayessche Netze) und semantische 
    Validierung (Transformer) werden als komplementäre Perspektiven behandelt.
    
    \item \textbf{Erklärbarkeit durch Design}: Die Modelle sind von Grund auf 
    transparent – jede Kategorie, jeder Zustand, jede Transition ist semantisch 
    gehaltvoll benannt.
    
    \item \textbf{iterative Validierung}: Die Modelle werden durch den Vergleich 
    empirischer und generierter Daten sowie durch semantische Ähnlichkeitsanalysen 
    validiert.
    
    \item \textbf{Reflexive Dokumentation}: Jede Interpretationsentscheidung wird 
    protokolliert und begründet.
\end{enumerate}

\section{Die ERIA-Methodologie im Überblick}

Die ERIA umfasst sechs methodische Schritte, die in Tabelle~\ref{tab:schritte} 
überblicksartig dargestellt sind:

\begin{table}[H]
\centering
\caption{Die sechs Schritte der ERIA-Methodologie}
\label{tab:schritte}
\begin{tabular}{@{} p{2.5cm} p{3cm} p{7cm} @{}}
\toprule
\textbf{Schritt} & \textbf{Bezeichnung} & \textbf{Zentrale Verfahren} \\
\midrule
1 & Interpretation & Sequenzielle Mikroanalyse, Lesartenproduktion \\
2 & Formalisierung & Terminalzeichen, Kategoriensystem \\
3 & Grammatikinduktion & Hierarchische Kompression, PCFG \\
4 & Prozessmodellierung & Petri-Netze (Nebenläufigkeit, Ressourcen) \\
5 & Probabilistische Modellierung & HMM, DBN (Unsicherheit, latente Variablen) \\
6 & Validierung \& Triangulation & CRF, Transformer-Embeddings, Attention \\
\bottomrule
\end{tabular}
\end{table}

\subsection{Schritt 1: Qualitative Sequenzanalyse}

Die Grundlage der ERIA bildet eine sequenzielle Mikroanalyse der Transkripte 
nach der Methode der objektiven Hermeneutik oder der Dokumentarischen Methode. 
Jeder Sprechakt wird hinsichtlich seiner sequenziellen Funktion und seiner 
latenten Sinnstruktur analysiert.

\subsection{Schritt 2: Formalisierung zu Terminalzeichen}

Die interpretativ gewonnenen Kategorien werden in ein System von Terminalzeichen 
überführt:

\begin{table}[H]
\centering
\caption{Terminalzeichen der ERIA}
\label{tab:terminal}
\begin{tabular}{@{} l l l @{}}
\toprule
\textbf{Symbol} & \textbf{Bedeutung} & \textbf{Beispiel} \\
\midrule
KBG & Kunden-Gruß & "Guten Tag" \\
VBG & Verkäufer-Gruß & "Guten Tag" \\
KBBd & Kunden-Bedarf & "Einmal Leberwurst, bitte" \\
VBBd & Verkäufer-Nachfrage & "Wie viel darf's sein?" \\
KBA & Kunden-Antwort & "Zweihundert Gramm" \\
VBA & Verkäufer-Reaktion & "Sonst noch etwas?" \\
KAE & Kunden-Erkundigung & "Kann ich die in Reissalat tun?" \\
VAE & Verkäufer-Auskunft & "Eher kurz anbraten" \\
KAA & Kunden-Abschluss & "Bitte", "Danke" \\
VAA & Verkäufer-Abschluss & "Das macht acht Mark zwanzig" \\
KAV & Kunden-Verabschiedung & "Auf Wiedersehen" \\
VAV & Verkäufer-Verabschiedung & "Schönen Tag noch" \\
\bottomrule
\end{tabular}
\end{table}

\subsection{Schritt 3: Hierarchische Grammatikinduktion (nach ARS 3.0)}

Die Terminalzeichenketten werden iterativ komprimiert, um interpretative 
Kategorien (Nonterminale) zu bilden:

\begin{lstlisting}[caption=Hierarchische Kompression in ERIA]
def compress_hierarchically(chains):
    """Hierarchische Kompression der Terminalzeichenketten"""
    current_chains = [list(chain) for chain in chains]
    grammar = {}
    reflection_log = []
    iteration = 0
    
    while True:
        # Suche nach relevantem Muster (mit Sprecherwechsel, Abschlusscharakter)
        pattern = find_relevant_pattern(current_chains)
        if pattern is None:
            break
        
        # Generiere interpretativen Namen
        nt_name = generate_interpretive_name(pattern)
        
        # Dokumentiere Entscheidung
        reflection_log.append({
            'pattern': pattern,
            'nonterminal': nt_name,
            'rationale': f"Wiederholtes Muster: {' → '.join(pattern)}"
        })
        
        # Komprimiere Ketten
        current_chains = compress_chains(current_chains, pattern, nt_name)
        grammar[nt_name] = pattern
        iteration += 1
        
        # Prüfe auf vollständige Kompression
        if all(len(chain) == 1 for chain in current_chains):
            break
    
    return grammar, current_chains, reflection_log
\end{lstlisting}

\subsection{Schritt 4: Petri-Netz-Modellierung (nach ARS 4.0, Petrinetze)}

Die induzierte Grammatik wird in ein Petri-Netz überführt, das Nebenläufigkeit 
und Ressourcen modelliert. Abbildung~\ref{fig:petrinet} zeigt das Grundgerüst 
des ERIA-Petri-Netzes.

\begin{figure}[H]
\centering
\begin{verbatim}
[Ressourcen-Stellen]               [Transitionen]              [Phasen-Stellen]
                                    
s_Kunde_bereit (1) ─────────────→ t_KBG ─────────────→ s_Phase_Begruessung
                                                               │
s_Verkäufer_bereit (1) ─────────→ t_VBG ←─────────────────────┘
                                       │
s_Waren_verfügbar (n) ───────────→ t_KBBd ←────────────────────┐
                                       │                        │
s_Phase_Begruessung ─────────────→ t_VBBd ←────────────────────┤
                                       │                        │
                                       └──────→ s_Phase_Bedarfsermittlung
                                                │
                                                ├──→ t_KBA
                                                ├──→ t_VBA
                                                ├──→ t_KAE
                                                └──→ t_VAE
\end{verbatim}
\caption{Grundstruktur des ERIA-Petri-Netzes}
\label{fig:petrinet}
\end{figure}

\begin{lstlisting}[caption=Petri-Netz-Konstruktion in ERIA]
class ERIAPetriNet:
    """Petri-Netz für ERIA"""
    
    def build_from_grammar(self, grammar, terminal_chains):
        """Baut Petri-Netz aus ERIA-Grammatik"""
        
        # 1. Ressourcen-Stellen
        self.add_place("s_Kunde_bereit", initial_tokens=1)
        self.add_place("s_Verkäufer_bereit", initial_tokens=1)
        self.add_place("s_Waren_verfügbar", initial_tokens=10)
        self.add_place("s_Geld_Kunde", initial_tokens=20)
        
        # 2. Phasen-Stellen
        for phase in ["Begrüßung", "Bedarfsermittlung", "Beratung", 
                      "Abschluss", "Verabschiedung"]:
            self.add_place(f"s_Phase_{phase}", initial_tokens=0)
        self.add_place("s_Phase_Start", initial_tokens=1)
        
        # 3. Transitionen aus Terminalzeichen
        for terminal in self.get_all_terminals(grammar):
            self.add_transition(f"t_{terminal}")
            
            # Verbinde mit Ressourcen und Phasen
            if terminal.startswith('K'):
                self.add_arc(f"s_Kunde_bereit", f"t_{terminal}")
            else:
                self.add_arc(f"s_Verkäufer_bereit", f"t_{terminal}")
            
            # Phasenübergänge
            phase_mapping = self.get_phase_mapping()
            if terminal in phase_mapping:
                from_phase, to_phase = phase_mapping[terminal]
                self.add_arc(f"s_Phase_{from_phase}", f"t_{terminal}")
                self.add_arc(f"t_{terminal}", f"s_Phase_{to_phase}")
        
        return self
\end{lstlisting}

\subsection{Schritt 5: Bayessche Modellierung (nach ARS 4.0, Bayes)}

Die ERIA nutzt Hidden-Markov-Modelle zur Modellierung latenter Gesprächsphasen 
und zur Quantifizierung von Unsicherheit:

\begin{lstlisting}[caption=HMM für ERIA]
class ERIABayesianModel:
    """Bayessche Modellierung in ERIA"""
    
    def __init__(self, n_states=5, n_symbols=12):
        self.n_states = n_states  # Begrüßung, Bedarfsermittlung, Beratung, Abschluss, Verabschiedung
        self.n_symbols = n_symbols  # Terminalzeichen
        self.state_names = {
            0: "Begrüßung", 1: "Bedarfsermittlung", 2: "Beratung",
            3: "Abschluss", 4: "Verabschiedung"
        }
    
    def initialize_from_ars(self, grammar):
        """Initialisiert HMM aus ERIA-Grammatik"""
        
        # Startwahrscheinlichkeiten
        startprob = np.zeros(self.n_states)
        startprob[0] = 0.7  # Begrüßung
        startprob[1] = 0.2  # Direkte Bedarfsermittlung
        startprob[4] = 0.1  # Direkte Verabschiedung
        
        # Übergangsmatrix (typischer Gesprächsverlauf)
        transmat = np.zeros((self.n_states, self.n_states))
        transmat[0, 1] = 0.8  # Begrüßung → Bedarfsermittlung
        transmat[1, 2] = 0.6  # Bedarfsermittlung → Beratung
        transmat[1, 3] = 0.3  # Bedarfsermittlung → Abschluss
        transmat[2, 3] = 0.5  # Beratung → Abschluss
        transmat[2, 2] = 0.4  # Beratung → Beratung
        transmat[3, 4] = 0.9  # Abschluss → Verabschiedung
        transmat[4, 4] = 1.0  # Verabschiedung → Verabschiedung
        
        # Emissionswahrscheinlichkeiten aus Grammatik
        emissionprob = self._compute_emissions_from_grammar(grammar)
        
        self.model = hmm.MultinomialHMM(n_components=self.n_states)
        self.model.startprob_ = startprob
        self.model.transmat_ = transmat
        self.model.emissionprob_ = emissionprob
        
        return self.model
\end{lstlisting}

\subsection{Schritt 6: Validierung durch computerlinguistische Verfahren}

Die ERIA nutzt drei computerlinguistische Verfahren zur komplementären Validierung:

\subsubsection{Conditional Random Fields (CRF)}

CRF modellieren sequenzielle Abhängigkeiten über den unmittelbaren Vorgänger 
hinaus und identifizieren relevante Kontextfaktoren:

\begin{lstlisting}[caption=CRF-Validierung in ERIA]
class ERIACRFValidator:
    """CRF-basierte Validierung der ERIA-Kategorien"""
    
    def extract_features(self, sequence, i):
        """Extrahiert Features für Position i"""
        features = {
            'symbol': sequence[i],
            'symbol.prefix_K': sequence[i].startswith('K'),
            'symbol.prefix_V': sequence[i].startswith('V'),
            'is_first': i == 0,
            'is_last': i == len(sequence) - 1,
        }
        
        # Kontext-Features
        for offset in [-2, -1, 1, 2]:
            if 0 <= i + offset < len(sequence):
                features[f'context_{offset:+d}'] = sequence[i + offset]
        
        # Bigram-Features
        if i > 0:
            features['bigram'] = f"{sequence[i-1]}_{sequence[i]}"
        
        return features
    
    def validate(self, chains):
        """Validiert die ERIA-Kategorien durch CRF-Training"""
        X = [[self.extract_features(seq, i) for i in range(len(seq))] 
             for seq in chains]
        y = [seq for seq in chains]
        
        crf = CRF(algorithm='lbfgs', max_iterations=100)
        crf.fit(X, y)
        
        # Wichtigste Features anzeigen
        top_features = sorted(crf.state_features_.items(), 
                             key=lambda x: abs(x[1]), reverse=True)[:10]
        
        return crf, top_features
\end{lstlisting}

\subsubsection{Transformer-Embeddings zur semantischen Validierung}

Die semantische Kohärenz der ERIA-Kategorien wird durch Transformer-Embeddings 
quantifiziert:

\begin{lstlisting}[caption=Semantische Validierung in ERIA]
class ERIASemanticValidator:
    """Transformer-basierte semantische Validierung"""
    
    def __init__(self, model_name='paraphrase-multilingual-MiniLM-L12-v2'):
        self.model = SentenceTransformer(model_name)
        self.symbol_to_texts = {
            'KBG': ['Guten Tag', 'Guten Morgen', 'Hallo'],
            'VBG': ['Guten Tag', 'Guten Morgen', 'Willkommen'],
            'KBBd': ['Einmal Leberwurst', 'Ich hätte gerne Käse'],
            'VBBd': ['Wie viel darf es sein?', 'Welche Sorte?'],
            # ... weitere Mapping
        }
    
    def validate_categories(self):
        """Berechnet Intra- und Inter-Kategorie-Ähnlichkeiten"""
        embeddings = {}
        for symbol, texts in self.symbol_to_texts.items():
            emb = self.model.encode(texts)
            embeddings[symbol] = np.mean(emb, axis=0)
        
        # Intra-Kategorie-Ähnlichkeit (Kohäsion)
        intra_similarities = {}
        for symbol, emb in embeddings.items():
            # Ähnlichkeit der Beispieltexte untereinander
            texts_emb = self.model.encode(self.symbol_to_texts[symbol])
            sim_matrix = cosine_similarity(texts_emb)
            intra_similarities[symbol] = np.mean(sim_matrix[np.triu_indices_from(sim_matrix, k=1)])
        
        # Inter-Kategorie-Ähnlichkeit (Diskrimination)
        # ...
        
        return intra_similarities, inter_similarities
\end{lstlisting}

\subsubsection{Attention-Mechanismen zur Identifikation relevanter Kontexte}

Attention-Mechanismen visualisieren, welche Vorgänger für die Vorhersage 
des nächsten Symbols besonders relevant sind:

\begin{lstlisting}[caption=Attention-Analyse in ERIA]
class ERIAttentionAnalyzer:
    """Attention-basierte Analyse relevanter Kontexte"""
    
    def compute_attention_weights(self, sequence):
        """Berechnet Attention-Gewichte basierend auf Bigram-Statistiken"""
        n = len(sequence)
        attention = np.zeros((n, n))
        
        # Berechne Bigram-Wahrscheinlichkeiten
        bigram_probs = self._compute_bigram_probs(sequence)
        
        for i in range(1, n):
            prev = sequence[i-1]
            current = sequence[i]
            
            # Attention auf direkten Vorgänger
            if (prev, current) in bigram_probs:
                attention[i, i-1] = bigram_probs[(prev, current)]
            
            # Exponentiell abfallende Attention auf entferntere Vorgänger
            for j in range(i-2, -1, -1):
                attention[i, j] = attention[i, j+1] * 0.5
        
        # Normalisierung
        for i in range(n):
            if attention[i].sum() > 0:
                attention[i] /= attention[i].sum()
        
        return attention
    
    def visualize_attention(self, sequence):
        """Visualisiert Attention-Gewichte als Heatmap"""
        attention = self.compute_attention_weights(sequence)
        
        plt.figure(figsize=(10, 8))
        sns.heatmap(attention, 
                   xticklabels=sequence, yticklabels=sequence,
                   cmap='viridis', annot=True, fmt='.2f')
        plt.title('ERIA: Attention-Gewichte zwischen Positionen')
        plt.xlabel('Vorgänger')
        plt.ylabel('Aktuelle Position')
        plt.show()
        
        return attention
\end{lstlisting}

\section{Empirische Anwendung: Acht Marktgespräche}

Im Folgenden wird die ERIA-Methodologie an den acht Transkripten von 
Marktgesprächen (Aachen, Juni/Juli 1994) demonstriert.

\subsection{Schritt 1-2: Interpretation und Formalisierung}

Die acht Transkripte wurden sequenziell analysiert und in Terminalzeichenketten 
überführt (siehe Anhang A). Tabelle~\ref{tab:chains} zeigt die resultierenden 
Ketten:

\begin{table}[H]
\centering
\caption{Terminalzeichenketten der acht Transkripte}
\label{tab:chains}
\begin{tabular}{@{} c l @{}}
\toprule
\textbf{Transkript} & \textbf{Terminalzeichenkette} \\
\midrule
1 (Metzgerei) & KBG, VBG, KBBd, VBBd, KBA, VBA, KBBd, VBBd, KBA, VAA, KAA, VAV, KAV \\
2 (Kirschen) & VBG, KBBd, VBBd, VAA, KAA, VBG, KBBd, VAA, KAA \\
3 (Fisch) & KBBd, VBBd, VAA, KAA \\
4 (Gemüse) & KBBd, VBBd, KBA, VBA, KBBd, VBA, KAE, VAE, KAA, VAV, KAV \\
5 (Gemüse 2) & KAV, KBBd, VBBd, KBBd, VAA, KAV \\
6 (Käse) & KBG, VBG, KBBd, VBBd, KAA \\
7 (Bonbon) & KBBd, VBBd, KBA, VAA, KAA \\
8 (Bäckerei) & KBG, VBBd, KBBd, VBA, VAA, KAA, VAV, KAV \\
\bottomrule
\end{tabular}
\end{table}

\subsection{Schritt 3: Hierarchische Grammatikinduktion}

Die hierarchische Kompression der Terminalzeichenketten führte zur Induktion 
von 13 Nonterminalen. Tabelle~\ref{tab:nonterm} zeigt eine Auswahl:

\begin{table}[H]
\centering
\caption{Induzierte Nonterminale der ERIA}
\label{tab:nonterm}
\begin{tabular}{@{} l l l @{}}
\toprule
\textbf{Nonterminal} & \textbf{Produktion} & \textbf{Interpretation} \\
\midrule
NT\_BEGRUESSUNG & KBG → VBG & Dialogischer Grußaustausch \\
NT\_BEDARFSKLAERUNG & KBBd → VBBd → KBA & Dreischrittige Bedarfsermittlung \\
NT\_INFORMATION & KAE → VAE → KAA & Informationsaustausch mit Abschluss \\
NT\_ABSCHLUSS & VAA → KAA & Beidseitiger Transaktionsabschluss \\
NT\_VERABSCHIEDUNG & VAV → KAV & Reziproke Verabschiedung \\
\bottomrule
\end{tabular}
\end{table}

\subsection{Schritt 4: Petri-Netz-Modellierung}

Das aus der Grammatik abgeleitete Petri-Netz umfasst 15 Stellen und 27 Transitionen. 
Die Analyse zeigt folgende Nebenläufigkeiten:

\begin{itemize}
    \item \textbf{Kunde sucht Geld} $\parallel$ \textbf{Verkäufer verpackt Ware}: 
    Diese Aktivitäten können parallel ablaufen, ohne sich zu behindern.
    \item \textbf{Kunde stellt Frage} $\parallel$ \textbf{Verkäufer bereitet Antwort vor}: 
    Parallele kognitive Prozesse.
\end{itemize}

Die Ressourcenanalyse zeigt, dass das Gespräch blockiert, wenn die Stelle 
\texttt{s\_Waren\_verfügbar} keine Token mehr enthält – ein Modellierungsergebnis, 
das der empirischen Beobachtung entspricht.

\subsection{Schritt 5: Bayessche Modellierung}

Das trainierte HMM identifiziert fünf latente Gesprächsphasen. Tabelle~\ref{tab:hmm} 
zeigt die Emissionswahrscheinlichkeiten für einen ausgewählten Zustand:

\begin{table}[H]
\centering
\caption{Emissionswahrscheinlichkeiten des Zustands "Beratung"}
\label{tab:hmm}
\begin{tabular}{@{} l l @{}}
\toprule
\textbf{Symbol} & \textbf{Wahrscheinlichkeit} \\
\midrule
KAE (Kunden-Erkundigung) & 0.35 \\
VAE (Verkäufer-Auskunft) & 0.35 \\
KBA (Kunden-Antwort) & 0.15 \\
VBA (Verkäufer-Reaktion) & 0.15 \\
\bottomrule
\end{tabular}
\end{table}

Die Viterbi-Dekodierung für Transkript 1 ergibt folgende Zustandssequenz:

\begin{verbatim}
KBG → VBG → KBBd → VBBd → KBA → VBA → KBBd → VBBd → KBA → VAA → KAA → VAV → KAV
 0     0      1       1      2      2      1       1      2      3      3      4      4
(Begrüßung:0, Bedarfsermittlung:1, Beratung:2, Abschluss:3, Verabschiedung:4)
\end{verbatim}

\subsection{Schritt 6: Validierung}

Die CRF-Analyse identifiziert die wichtigsten Prädiktoren für die Terminalzeichen:

\begin{table}[H]
\centering
\caption{Wichtigste CRF-Features}
\label{tab:crf}
\begin{tabular}{@{} l l c @{}}
\toprule
\textbf{Feature} & \textbf{Vorhersage} & \textbf{Gewicht} \\
\midrule
bigram:KBG\_VBG & VBG & +2.345 \\
symbol:VAA & VAV & +1.987 \\
context\_-1:VAA & KAA & +1.432 \\
symbol.prefix\_K & KBA & +1.234 \\
\bottomrule
\end{tabular}
\end{table}

Die semantische Validierung zeigt hohe Intra-Kategorie-Ähnlichkeiten (0.83-0.95) 
und bestätigt damit die Kohärenz der interpretativen Kategorien.

\section{Integration: Von der ARS 4.0 zur ERIA 1.0}

Die ERIA 1.0 integriert die drei parallel entwickelten Erweiterungen der ARS 4.0 
zu einer kohärenten Methodologie. Tabelle~\ref{tab:integration} zeigt die 
Zuordnung der Verfahren zu den methodischen Schritten:

\begin{table}[H]
\centering
\caption{Integration der ARS-4.0-Erweiterungen in ERIA 1.0}
\label{tab:integration}
\begin{tabular}{@{} p{3cm} p{4cm} p{6cm} @{}}
\toprule
\textbf{ARS-4.0-Erweiterung} & \textbf{ERIA-Schritt} & \textbf{Mehrwert} \\
\midrule
PCFG (ARS 3.0) & Schritt 3 & Hierarchische Kategorienbildung \\
Petri-Netze & Schritt 4 & Nebenläufigkeit, Ressourcen, Zustandsübergänge \\
Bayessche Netze/HMM & Schritt 5 & Unsicherheit, latente Variablen, Inferenz \\
CRF, Transformer, Attention & Schritt 6 & Validierung, semantische Kohärenz, Kontextanalyse \\
\bottomrule
\end{tabular}
\end{table}

Die ERIA 1.0 ist kein rein technisches Verfahren, sondern eine methodologische 
Rahmung, die den Primat der Interpretation wahrt. Die formale Modellierung dient 
der Explikation, nicht der Substitution hermeneutischer Arbeit.

\section{Diskussion}

\subsection{Methodologische Bewertung}

Die ERIA erfüllt die zentralen methodologischen Anforderungen qualitativer 
Forschung:

\begin{enumerate}
    \item \textbf{Transparenz}: Jede Interpretationsentscheidung wird dokumentiert, 
    jedes formale Modell ist semantisch gehaltvoll benannt.
    
    \item \textbf{Intersubjektive Nachvollziehbarkeit}: Die sechs Schritte sind 
    klar definiert und können von Drittforschern repliziert werden.
    
    \item \textbf{Reflexivität}: Die methodologische Reflexionsebene zwingt zur 
    expliziten Begründung jeder Entscheidung.
    
    \item \textbf{Triangulation}: Die verschiedenen formalen Perspektiven (PCFG, 
    Petri-Netz, HMM, CRF, Transformer) erlauben eine mehrdimensionale Validierung.
\end{enumerate}

\subsection{Mehrwert gegenüber bestehenden Ansätzen}

Die ERIA bietet gegenüber den Ausgangsverfahren mehrere Vorteile:

\begin{itemize}
    \item \textbf{Gegenüber reiner Hermeneutik}: Formale Modellierung, 
    Nachvollziehbarkeit, Skalierbarkeit.
    \item \textbf{Gegenüber reiner PCFG (ARS 3.0)}: Nebenläufigkeit, Ressourcen, 
    Unsicherheit, latente Variablen.
    \item \textbf{Gegenüber reinen Petri-Netzen}: Anbindung an interpretative 
    Kategorien, semantische Gehalte.
    \item \textbf{Gegenüber reinen HMM}: Hierarchische Struktur, semantische 
    Validierung, methodologische Kontrolle.
    \item \textbf{Gegenüber "Black-Box"-KI}: Erklärbarkeit durch Design, keine Opazität.
\end{itemize}

\subsection{Grenzen}

Die ERIA hat auch Grenzen, die zu reflektieren sind:

\begin{enumerate}
    \item \textbf{Aufwand}: Die sequenzielle Mikroanalyse ist zeitintensiv und 
    erfordert geschulte Interpret:innen.
    
    \item \textbf{Fallzahl}: Bei sehr großen Korpora (n > 100) stößt die manuelle 
    Interpretation an Grenzen.
    
    \item \textbf{Domänenspezifität}: Die Kategorienbildung ist auf die 
    spezifische Interaktionsdomäne (Verkaufsgespräche) zugeschnitten.
    
    \item \textbf{Technische Abhängigkeiten}: Die computerlinguistischen Verfahren 
    setzen vortrainierte Modelle voraus (z.B. Sentence-Transformer).
\end{enumerate}

\subsection{Vergleich mit CGTI}

Die ERIA unterscheidet sich von der \textbf{Computational Grounded Theory Integration 
(CGTI)} in drei zentralen Punkten:

\begin{table}[H]
\centering
\caption{ERIA vs. CGTI}
\label{tab:vergleich}
\begin{tabular}{@{} p{4cm} p{4cm} p{4cm} @{}}
\toprule
\textbf{Kriterium} & \textbf{ERIA} & \textbf{CGTI} \\
\midrule
Rolle formaler Modelle & Explikation interpretativer Kategorien & Ergänzung zur Hermeneutik \\
Petri-Netze & Integriert (Schritt 4) & Nicht vorgesehen \\
Bayessche Verfahren & Integriert (Schritt 5) & Nicht vorgesehen \\
Computerlinguistik & Validierung (Schritt 6) & Kontrafaktische Exploration (Phase 3) \\
Methodologische Grundlage & ARS 3.0/4.0 & CGTI (eigenständig) \\
\bottomrule
\end{tabular}
\end{table}

Die ERIA ist formal präziser (Petri-Netze, HMM) und bietet eine umfassendere 
Modellierung von Nebenläufigkeit und Unsicherheit. Die CGTI ist hermeneutisch 
konservativer und verzichtet auf formale Prozessmodellierung.

\section{Fazit und Ausblick}

Die \textbf{Erklärbar Rekursive Interaktionsanalyse (ERIA) 1.0} integriert die 
Stärken dreier methodologischer Traditionen: die Tiefe der qualitativen Sequenzanalyse, 
die Präzision formaler Prozessmodellierung (Petri-Netze, HMM) und die Skalierbarkeit 
computerlinguistischer Verfahren (CRF, Transformer, Attention). Die methodologische 
Kontrolle bleibt durch den Primat der Interpretation und die reflexive Dokumentation 
gewahrt.

Weiterführende Forschung könnte die ERIA in mehreren Richtungen entwickeln:

\begin{enumerate}
    \item \textbf{ERIA 2.0}: Integration von Large Language Models als 
    kontrafaktische Explorationswerkzeuge (nach CGTI, Phase 3)
    
    \item \textbf{ERIA 3.0}: Entwicklung einer Softwareumgebung zur Unterstützung 
    der sechs Schritte (Transkription → Terminalzeichen → Grammatik → Petri-Netz 
    → HMM → Validierung)
    
    \item \textbf{ERIA 4.0}: Anwendung auf andere Interaktionsdomänen (Arzt-Patienten-Gespräche, 
    Unterrichtsinteraktionen, politische Debatten)
    
    \item \textbf{ERIA 5.0}: Methodologische Reflexion der Grenzen formaler 
    Modellierung in den Sozialwissenschaften
\end{enumerate}

Die ERIA 1.0 versteht sich als Beitrag zu einer \textbf{erklärbaren qualitativen 
Forschung}, die die methodologischen Standards der Disziplin wahrt und zugleich 
die Präzision formaler Verfahren nutzt.

\newpage
\begin{thebibliography}{99}

\bibitem[Barredo Arrieta et al.(2020)]{BarredoArrieta2020}
Barredo Arrieta, A. et al. (2020). Explainable Artificial Intelligence (XAI): 
Concepts, taxonomies, opportunities and challenges toward responsible AI. 
\textit{Information Fusion}, 58, 82-115.

\bibitem[Flick(2019)]{Flick2019}
Flick, U. (2019). \textit{Qualitative Sozialforschung: Eine Einführung} (9. Aufl.). 
Rowohlt.

\bibitem[Jensen(1997)]{Jensen1997}
Jensen, K. (1997). \textit{Coloured Petri Nets: Basic Concepts, Analysis Methods 
and Practical Use}. Springer.

\bibitem[Lafferty et al.(2001)]{Lafferty2001}
Lafferty, J., McCallum, A., \& Pereira, F. (2001). Conditional Random Fields. 
\textit{Proceedings of ICML 2001}, 282-289.

\bibitem[Manning \& Schütze(1999)]{Manning1999}
Manning, C. D., \& Schütze, H. (1999). \textit{Foundations of Statistical Natural 
Language Processing}. MIT Press.

\bibitem[Murphy(2002)]{Murphy2002}
Murphy, K. P. (2002). \textit{Dynamic Bayesian Networks}. PhD Thesis, UC Berkeley.

\bibitem[Oevermann et al.(1979)]{Oevermann1979}
Oevermann, U. et al. (1979). Die Methodologie einer objektiven Hermeneutik. 
In H.-G. Soeffner (Hrsg.), \textit{Interpretative Verfahren in den Sozial- und 
Textwissenschaften} (S. 352-434). Metzler.

\bibitem[Pearl(1988)]{Pearl1988}
Pearl, J. (1988). \textit{Probabilistic Reasoning in Intelligent Systems}. 
Morgan Kaufmann.

\bibitem[Petri(1962)]{Petri1962}
Petri, C. A. (1962). \textit{Kommunikation mit Automaten}. Dissertation, TU Darmstadt.

\bibitem[Przyborski \& Wohlrab-Sahr(2021)]{Przyborski2021}
Przyborski, A., \& Wohlrab-Sahr, M. (2021). \textit{Qualitative Sozialforschung} 
(5. Aufl.). De Gruyter Oldenbourg.

\bibitem[Rabiner(1989)]{Rabiner1989}
Rabiner, L. R. (1989). A tutorial on hidden Markov models. 
\textit{Proceedings of the IEEE}, 77(2), 257-286.

\bibitem[Reimers \& Gurevych(2019)]{Reimers2019}
Reimers, N., \& Gurevych, I. (2019). Sentence-BERT. \textit{Proceedings of 
EMNLP-IJCNLP 2019}, 3982-3992.

\bibitem[Sacks et al.(1974)]{Sacks1974}
Sacks, H., Schegloff, E. A., \& Jefferson, G. (1974). A simplest systematics 
for turn-taking. \textit{Language}, 50(4), 696-735.

\bibitem[Vaswani et al.(2017)]{Vaswani2017}
Vaswani, A. et al. (2017). Attention Is All You Need. 
\textit{Advances in Neural Information Processing Systems 30}, 5998-6008.

\end{thebibliography}

\newpage
\appendix
\section{Die acht Transkripte mit Terminalzeichen}

\subsection{Transkript 1 - Metzgerei}
\textbf{Terminalzeichenkette 1:} KBG, VBG, KBBd, VBBd, KBA, VBA, KBBd, VBBd, KBA, VAA, KAA, VAV, KAV

\subsection{Transkript 2 - Marktplatz (Kirschen)}
\textbf{Terminalzeichenkette 2:} VBG, KBBd, VBBd, VAA, KAA, VBG, KBBd, VAA, KAA

\subsection{Transkript 3 - Fischstand}
\textbf{Terminalzeichenkette 3:} KBBd, VBBd, VAA, KAA

\subsection{Transkript 4 - Gemüsestand}
\textbf{Terminalzeichenkette 4:} KBBd, VBBd, KBA, VBA, KBBd, VBA, KAE, VAE, KAA, VAV, KAV

\subsection{Transkript 5 - Gemüsestand 2}
\textbf{Terminalzeichenkette 5:} KAV, KBBd, VBBd, KBBd, VAA, KAV

\subsection{Transkript 6 - Käseverkaufsstand}
\textbf{Terminalzeichenkette 6:} KBG, VBG, KBBd, VBBd, KAA

\subsection{Transkript 7 - Bonbonstand}
\textbf{Terminalzeichenkette 7:} KBBd, VBBd, KBA, VAA, KAA

\subsection{Transkript 8 - Bäckerei}
\textbf{Terminalzeichenkette 8:} KBG, VBBd, KBBd, VBA, VAA, KAA, VAV, KAV

\end{document}
```