Inhalt
Aktueller Ordner:
/ARS_PreNSymAI_Ger.tex
% Deutsche Version
\documentclass[12pt,a4paper]{article}
\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
\usepackage{lmodern}
\usepackage{amsmath,amssymb}
\usepackage{graphicx}
\usepackage{xcolor}
\usepackage{hyperref}
\usepackage{geometry}
\geometry{a4paper, left=3cm, right=3cm, top=3cm, bottom=3cm}
\usepackage{setspace}
\onehalfspacing
\usepackage{parskip}
\usepackage[ngerman]{babel}
\usepackage{csquotes}
\usepackage{microtype}
\usepackage{booktabs}
\usepackage{longtable}
\usepackage{array}
\usepackage{listings}
\usepackage{caption}
\usepackage{subcaption}
\usepackage{float}
\usepackage{url}
\usepackage{natbib}
\usepackage{titling}
\lstset{
language=Lisp,
basicstyle=\ttfamily\small,
keywordstyle=\color{blue},
commentstyle=\color{green!40!black},
stringstyle=\color{red},
showstringspaces=false,
numbers=left,
numberstyle=\tiny,
numbersep=5pt,
breaklines=true,
frame=single,
backgroundcolor=\color{gray!5},
tabsize=2,
captionpos=b
}
\title{\Huge\textbf{Grammatikinduktion, Transduktion und Parsing} \\
\LARGE Die ARS als methodologischer Vorläufer \\
\LARGE erklärbarer neuro-symbolischer KI}
\author{
\large
\begin{tabular}{c}
Paul Koop
\end{tabular}
}
\date{\large 1994--2026}
\begin{document}
\maketitle
\begin{abstract}
Dieser Beitrag untersucht das historische und methodologische Verhältnis zwischen
der Algorithmisch Rekursiven Sequenzanalyse (ARS) und der zeitgenössischen
neuro-symbolischen KI. Auf der Grundlage von drei frühen ARS-Implementierungen
– einem Induktor in Scheme, einem Parser in Pascal und einem Transduktor in
Lisp (1994) – sowie einer Simulation eines großen Sprachmodells in Python (2023)
argumentiere ich, dass die ARS eine \textit{proto-neuro-symbolische} Methodologie
darstellt. Im Gegensatz zu rein statistischen Sprachmodellen produziert die ARS
explizite, falsifizierbare und intersubjektiv prüfbare Grammatiken. Der Beitrag
zeigt, dass die zentralen Herausforderungen der heutigen neuro-symbolischen KI
– die Integration von Mustererkennung und regelbasiertem Schließen, die Sicherung
von Erklärbarkeit und die Wahrung methodologischer Kontrolle – in der ARS bereits
vor Jahrzehnten adressiert wurden. Ich ordne die ARS in Henry Kautz' Taxonomie
neuro-symbolischer Architekturen ein, evaluiere sie anhand der XAI-Kriterien
(Verständlichkeit, Genauigkeit, Wissensgrenzen) und kontrastiere sie mit großen
Sprachmodellen, die simulieren, ohne zu erklären. Der Beitrag schließt mit
methodologischen Lehren für die zeitgenössische neuro-symbolische Forschung.
\end{abstract}
\newpage
\tableofcontents
\newpage
\section{Einleitung: Das verborgene Erbe der ARS}
Der gegenwärtige Diskurs über neuro-symbolische KI ist von einer merkwürdigen
Amnesie geprägt. Während Forscher über Architekturen debattieren, die neuronale
Netze mit symbolischem Schließen integrieren \citep{hitzler2022neuro, garcez2020neurosymbolic},
ist ein methodologisch anspruchsvoller Vorläufer weitgehend in Vergessenheit
geraten: die \textbf{Algorithmisch Rekursive Sequenzanalyse (ARS)}.
Die ARS, ursprünglich 1994 entwickelt und bis 2026 kontinuierlich verfeinert,
stellt einen der frühesten systematischen Versuche dar, qualitative Hermeneutik
mit formaler Grammatikinduktion zu verbinden. Im Gegensatz zu zeitgenössischen
großen Sprachmodellen (LLMs), die statistische Muster aus massiven Korpora
lernen, aber opak bleiben, produziert die ARS \textbf{explizite, falsifizierbare
und intersubjektiv prüfbare Grammatiken}. Anders als rein symbolische Ansätze,
die am Wissenserwerbsproblem leiden, induziert die ARS Regeln aus empirischen
Protokollen.
Dieser Beitrag leistet drei Dinge:
\begin{enumerate}
\item Er rekonstruiert drei frühe ARS-Implementierungen – einen
\textbf{Induktor} in Scheme, einen \textbf{Parser} in Pascal und einen
\textbf{Transduktor} in Lisp – und zeigt, wie jede einen anderen Aspekt
der Sequenzanalyse adressiert.
\item Er interpretiert diese Implementierungen als \textbf{proto-neuro-symbolische}
Systeme und ordnet sie in Henry Kautz' Taxonomie neuro-symbolischer
Architekturen ein \citep{kautz2020third}.
\item Er kontrastiert die ARS mit einem großen Sprachmodell, das auf demselben
Korpus trainiert wurde, und zeigt, dass LLMs simulieren, aber nicht
\textit{erklären} – eine Unterscheidung, die für die XAI-Kriterien
(Explainable AI) zentral ist \citep{ortigossa2024xai}.
\end{enumerate}
Der Beitrag behauptet nicht, dass die ARS ein neuro-symbolisches System im
zeitgenössischen Sinne sei – ihr fehlen neuronale Komponenten. Vielmehr
argumentiere ich, dass die ARS die \textit{methodologische Logik} neuro-symbolischer
Integration verkörpert: die Kombination von musterbasierter Induktion (System 1)
mit regelbasierter Explikation (System 2) unter Wahrung der Erklärbarkeit durch
Design.
\section{Drei Implementierungen, ein Korpus}
\subsection{Die empirische Grundlage: Ein Marktgespräch}
Alle in diesem Beitrag analysierten Implementierungen basieren auf demselben
empirischen Korpus: einem transkribierten Verkaufsgespräch, das am 28. Juni 1994
auf dem Aachener Marktplatz aufgenommen wurde. Das Transkript wurde einer
qualitativen Sequenzanalyse nach der Methode der objektiven Hermeneutik
\citep{oevermann1979methodology} unterzogen, was zu einer Terminalzeichenkette
mit 12 Kategorien führte (KBG, VBG, KBBd, VBBd, KBA, VBA, KAE, VAE, KAA, VAA,
KAV, VAV).
Die durchgängig verwendete Terminalzeichenkette lautet:
\begin{verbatim}
KBG VBG KBBd VBBd KBA VBA KBBd VBBd KBA VBA KAE VAE KAE VAE KAA VAA KAV VAV
\end{verbatim}
\subsection{Induktor (Scheme, 1994): Vom Korpus zur Grammatik}
Der Induktor, geschrieben in Scheme, ist die grundlegende Komponente der ARS.
Seine Funktion ist es, ein Korpus von Terminalzeichen zu lesen und eine
probabilistische kontextfreie Grammatik (PCFG) durch Zählung von Transitionen
zu induzieren.
\subsubsection{Zentrale Datenstrukturen}
\begin{lstlisting}[caption=Lexikon und Transformationsmatrix in Scheme]
;; Lexikon: 12 Terminalzeichen
(define lexikon (vector 'KBG 'VBG 'KBBd 'VBBd 'KBA 'VBA
'KAE 'VAE 'KAA 'VAA 'KAV 'VAV))
;; Transformationsmatrix zur Zählung von Übergängen
(define matrix (vector zeile0 zeile1 ... zeile17))
;; Funktion zum Zählen der Transitionen
(define (transformationenZaehlen korpus)
(vector-set! (vector-ref matrix (izeichen (car korpus)))
(izeichen (car(cdr korpus)))
(+ 1 (vector-ref (vector-ref matrix (izeichen (car korpus)))
(izeichen (car(cdr korpus))))))
(if(not(null? (cdr (cdr korpus))))
(transformationenZaehlen (cdr korpus))))
\end{lstlisting}
\subsubsection{Induzierte Grammatik}
Die resultierende Grammatik lautet:
\begin{verbatim}
(KBG -> . VBG)
(VBG -> . KBBd)
(KBBd -> . VBBd)
(VBBd -> . KBA)
(KBA -> . VBA)
(VBA -> . KBBd) (VBA -> . KAE)
(KAE -> . VAE)
(VAE -> . KAE) (VAE -> . KAA)
(KAA -> . VAA)
(VAA -> . KAV)
(KAV -> . VAV)
\end{verbatim}
\subsubsection{Interpretation}
Der Induktor transformiert das empirische Protokoll in ein \textbf{explizites
Regelsystem}. Jede Produktionsregel ist mit ihrer empirischen Häufigkeit
gewichtet. Diese Transformation ist reversibel: Aus der Grammatik können
Sequenzen generiert werden, die die statistischen Eigenschaften des
ursprünglichen Korpus reproduzieren.
In neuro-symbolischer Terminologie führt der Induktor eine \textbf{symbolische
Abstraktion} aus diskreten Daten durch. Er lernt Gewichte nicht durch
Backpropagation, sondern durch einfaches Zählen – ein transparenter,
verifizierbarer Prozess.
\subsection{Parser (Pascal, 1992): Validierung von Wohlgeformtheit}
Der Parser, geschrieben in Pascal, implementiert einen Chart-Parser, der
entscheidet, ob eine gegebene Terminalzeichenkette \textit{wohlgeformt} im
Sinne der induzierten Grammatik ist.
\subsubsection{Wichtige Datentypen}
\begin{lstlisting}[caption=Parserdatenstrukturen in Pascal]
TYPE
TKategorien = (Leer, VKG, BG, VT, AV, B, A, BBD, BA, AE, AA,
KBG, VBG, KBBD, VBBD, KBA, VBA, KAE, VAE,
KAA, VAA, KAV, VAV);
TKante = RECORD
Kategorie : TKategorien;
vor, nach, zeigt : PTKante;
gefunden : PTKantenListe;
aktiv : BOOLEAN;
nummer : INTEGER;
CASE Wort : BOOLEAN OF
TRUE : (inhalt : STRING);
FALSE : (gesucht : PTKategorienListe);
END;
\end{lstlisting}
\subsubsection{Parsing-Algorithmus}
Der Parser implementiert einen Standard-Chart-Parsing-Algorithmus mit drei
Kernregeln:
\begin{enumerate}
\item \textbf{Initialisierung}: Terminalsymbole werden als aktive Kanten
eingefügt.
\item \textbf{Prädiktion}: Neue Kanten werden für Nonterminale erzeugt,
die an einer bestimmten Position beginnen können.
\item \textbf{Komplettierung}: Wenn ein Nonterminal vollständig erkannt ist,
werden übergeordnete Regeln komplettiert.
\end{enumerate}
\subsubsection{Interpretation}
Der Parser operationalisiert den Begriff der \textbf{strukturellen
Wohlgeformtheit}. Eine Sequenz ist nicht nur "plausibel", sondern formal
entscheidbar. Dies antizipiert den deterministischen endlichen Automaten (DFA),
der später in \texttt{ARS\_XAI\_Aut\_Ger.tex} formalisiert wurde.
In XAI-Terminologie verkörpert der Parser \textbf{Erklärbarkeit durch Design}:
Jede Entscheidung, eine Sequenz zu akzeptieren oder zu verwerfen, kann auf
explizite Regeln zurückgeführt werden.
\subsection{Transduktor (Lisp, 1994): Generierung neuer Protokolle}
Der Transduktor, geschrieben in Lisp, generiert aus der induzierten Grammatik
neue Terminalzeichenketten und simuliert so mögliche Verkaufsgespräche.
\subsubsection{Generierungsalgorithmus}
\begin{lstlisting}[caption=Transduktor in Lisp]
;; Generiert die Sequenz
(defun gs (st r)
(cond
((equal st nil) nil)
((atom st) (cons st (gs (next st r (random 101)) r)))
(t (cons (eval st) (gs (next st r (random 101)) r)))
)
)
;; Wählt das nächste Symbol basierend auf gewichteten Wahrscheinlichkeiten
(defun next (st r z)
(cond
((equal r nil) nil)
((and (<= z (car (cdr (car r))))
(equal st (car (car r))))
(car (reverse (car r))))
(t (next st (cdr r) z))
)
)
\end{lstlisting}
\subsubsection{Beispielausgabe}
Eine typische generierte Sequenz (Klammern zur Lesbarkeit entfernt):
\begin{verbatim}
KBG VBG KBBD VBBD KBA VBA KAE VAE KAA VAA
KBBD VBBD KBA VBA KBBD VBBD KBA VBA KBBD VBBD KBA VBA KAE VAE KAA VAA
KAV VAV
\end{verbatim}
\subsubsection{Interpretation}
Der Transduktor ist ein \textbf{generatives Modell} – aber anders als ein LLM
ist sein Generierungsprozess vollständig transparent. Jedes Symbol wird durch
eine Regel produziert, die inspiziert, zurückverfolgt und gerechtfertigt werden
kann. Der Transduktor halluziniert nicht; er folgt der Grammatik.
\subsection{Das große Sprachmodell (Python, 2023): Simulation ohne Erklärung}
Zum Vergleich wurde ein tiefes Sprachmodell (LSTM-basiert) auf demselben Korpus
trainiert. Die Modellarchitektur folgt der in \citet{trask2020neural}
beschriebenen Implementierung.
\subsubsection{Modellarchitektur}
\begin{lstlisting}[caption=LSTM-Sprachmodell in Python]
class LSTMCell(Layer):
def __init__(self, n_inputs, n_hidden, n_output):
self.xf = Linear(n_inputs, n_hidden)
self.xi = Linear(n_inputs, n_hidden)
self.xo = Linear(n_inputs, n_hidden)
self.xc = Linear(n_inputs, n_hidden)
self.hf = Linear(n_hidden, n_hidden, bias=False)
self.hi = Linear(n_hidden, n_hidden, bias=False)
self.ho = Linear(n_hidden, n_hidden, bias=False)
self.hc = Linear(n_hidden, n_hidden, bias=False)
self.w_ho = Linear(n_hidden, n_output, bias=False)
\end{lstlisting}
\subsubsection{Beispielausgabe}
\begin{verbatim}
KBG VBG
KBBD VBBD KBA VBA KAE VAE KAA VAA
KBBD VBBD KBA VBA KBBD VBBD KBA VBA KBBD VBBD KBA VBA KAE VAE
KAA VAA
KAV VAV
KBG VBG
KBBD VBBD KBA VBA KAE VAE KAE VAE KAE VAE KAE VAE KAA VAA
\end{verbatim}
\subsubsection{Interpretation}
Die LLM-Ausgabe ist \textbf{oberflächlich nicht unterscheidbar} von der
Ausgabe des Transduktors. Beide generieren plausible Sequenzen von
Terminalzeichen. Die Ähnlichkeit trügt jedoch:
\begin{itemize}
\item Die \textbf{Ausgabe des Transduktors} wird durch explizite,
inspizierbare Regeln erzeugt. Die Produktion jedes Symbols kann auf eine
Grammatikregel zurückgeführt werden.
\item Die \textbf{Ausgabe des LLM} wird durch interne Gewichte erzeugt, die
nicht direkt interpretierbar sind. Man kann nicht erklären, \textit{warum}
ein bestimmtes Symbol gewählt wurde.
\end{itemize}
Wie im Original-Notebook vermerkt:
\blockquote{Im Gegensatz zu kognitivistischen Modellen (ARS, Grammar Induction,
Parser, Grammar Transduction) erklärt ein solches Großes Sprachmodell nichts
und deshalb werden Große Sprachmodelle von Postmodernismus, Posthumanismus und
Transhumanismus mit parasitärer Intention gefeiert.}
\section{ARS als proto-neuro-symbolische KI}
\subsection{Das neuro-symbolische Forschungsprogramm}
Neuro-symbolische KI integriert neuronale Methoden (Mustererkennung, Lernen aus
Daten) mit symbolischen Methoden (Logik, Regeln, Schließen). Henry Kautz'
Taxonomie \citep{kautz2020third} unterscheidet mehrere Architekturmuster:
\begin{table}[H]
\centering
\caption{Kautz' neuro-symbolische Architekturen}
\label{tab:kautz}
\begin{tabular}{@{} p{4cm} p{8cm} @{}}
\toprule
\textbf{Architektur} & \textbf{Beschreibung} \\
\midrule
Neural | Symbolic & Neuronale Wahrnehmung, symbolisches Schließen \\
Neural: Symbolic → Neural & Symbolische Generierung von Trainingsdaten \\
NeuralSymbolic & Aus symbolischen Regeln generierte neuronale Netze \\
Neural[Symbolic] & In neuronale Netze eingebettetes symbolisches Schließen \\
\bottomrule
\end{tabular}
\end{table}
\subsection{Verortung der ARS in der Taxonomie}
Die ARS passt nicht genau in eine einzelne Kategorie, da sie unabhängig vom
neuronalen Paradigma entwickelt wurde. Wenn wir jedoch den qualitativen
Interpretationsprozess als eine Form der \textbf{Mustererkennung} (System 1)
und die Grammatikinduktion als \textbf{symbolisches Schließen} (System 2)
auffassen, nähert sich die ARS dem Muster \textbf{Neural | Symbolic} an:
\begin{itemize}
\item \textbf{Mustererkennung} (System 1): Der menschliche Interpret
identifiziert wiederkehrende Muster im Transkript, produziert Lesarten
und falsifiziert Alternativen – eine Form der musterbasierte Kognition.
\item \textbf{Symbolisches Schließen} (System 2): Die induzierte Grammatik,
der Parser und der Transduktor bilden ein formales symbolisches System, das
ausgeführt, inspiziert und validiert werden kann.
\end{itemize}
Was die ARS von zeitgenössischen neuro-symbolischen Systemen unterscheidet, ist
dass die Mustererkennungskomponente \textbf{menschlich}, nicht neuronal ist.
Dies ist keine Schwäche, sondern eine bewusste methodologische Entscheidung:
Sie stellt sicher, dass die Mustererkennung interpretierbar bleibt und der
intersubjektiven Validierung unterliegt.
\subsection{Die drei Komponenten als komplementäre neuro-symbolische Funktionen}
\begin{table}[H]
\centering
\caption{ARS-Komponenten und ihre neuro-symbolischen Funktionen}
\label{tab:components}
\begin{tabular}{@{} p{3cm} p{4cm} p{6cm} @{}}
\toprule
\textbf{Komponente} & \textbf{Sprache} & \textbf{Neuro-symbolische Funktion} \\
\midrule
Induktor & Scheme & Symbolabstraktion aus diskreten Daten \\
Parser & Pascal & Strukturelle Validierung, Wohlgeformtheitsprüfung \\
Transduktor & Lisp & Generative Regelanwendung \\
LLM (Kontrast) & Python & Reine Mustererkennung ohne Erklärung \\
\bottomrule
\end{tabular}
\end{table}
Zusammen bilden diese drei Komponenten eine \textbf{vollständige Pipeline} von
empirischen Daten zum generativen Modell – eine Pipeline, die in jedem Schritt
vollständig transparent ist.
\section{XAI-Validierung der ARS}
Die drei NIST-XAI-Kriterien \citep{ortigossa2024xai} bieten einen Rahmen für
die Bewertung von Erklärbarkeit:
\subsection{Verständlichkeit}
\begin{itemize}
\item \textbf{Induktor}: Die Transformationsmatrix und die Produktionsregeln
sind direkt interpretierbar. Jede Regel entspricht einem beobachteten
Übergang im Korpus.
\item \textbf{Parser}: Zustände (KBG, VBG, VKG usw.) sind semantisch
gehaltvolle Kategorien, die aus qualitativer Interpretation abgeleitet sind.
\item \textbf{Transduktor}: Die Generierung folgt expliziten Regeln, die
inspiziert werden können.
\item \textbf{LLM}: Gewichte und verborgene Zustände sind nicht direkt
interpretierbar.
\end{itemize}
\subsection{Genauigkeit}
\begin{itemize}
\item \textbf{Induktor}: Die induzierte Grammatik reproduziert die
empirischen Übergangshäufigkeiten mit hoher Korrelation (r = 0,9999).
\item \textbf{Parser}: Wohlgeformtheitsentscheidungen sind deterministisch
und verifizierbar.
\item \textbf{Transduktor}: Generierte Sequenzen folgen der statistischen
Verteilung des Korpus.
\item \textbf{LLM}: Der Trainingsverlust sinkt, aber das Modell produziert
keine expliziten Regeln, die gegen die Daten validiert werden können.
\end{itemize}
\subsection{Wissensgrenzen}
\begin{itemize}
\item \textbf{ARS}: Die Grammatik dokumentiert explizit ihre Datenbasis
(8 Transkripte, 59 Interakte). Sie erhebt keinen Anspruch auf
Generalisierung über das Korpus hinaus.
\item \textbf{LLM}: Die Grenzen des Modells sind nicht explizit repräsentiert.
Es kann halluzinieren oder plausible, aber ungültige Sequenzen produzieren,
ohne Unsicherheit zu signalisieren.
\end{itemize}
\section{Simulation vs. Erklärung: Die fundamentale Unterscheidung}
\subsection{Was LLMs tun: Statistische Simulation}
Große Sprachmodelle lernen die statistische Verteilung von Token-Sequenzen aus
Trainingsdaten. Bei der Generierung sampeln sie aus dieser gelernten Verteilung.
Dies ist \textbf{Simulation}: Das Modell produziert Ausgaben, die der
Trainingsverteilung ähneln.
Entscheidend ist, dass Simulation kein Verständnis der \textit{Regeln} erfordert,
die die Daten erzeugen. Ein LLM, das auf einem Korpus von Verkaufsgesprächen
trainiert wurde, kann plausible neue Gespräche generieren, ohne jemals Konzepte
wie "Begrüßung", "Bedarfsklärung" oder "Verabschiedung" zu repräsentieren.
\subsection{Was die ARS tut: Explikative Rekonstruktion}
Die ARS zielt dagegen auf \textbf{explikative Rekonstruktion}. Sie induziert
explizite Regeln, die die beobachteten Regularitäten \textit{konstituieren}.
Diese Regeln sind nicht nur statistische Zusammenfassungen, sondern
\textbf{generative Mechanismen}, die:
\begin{enumerate}
\item \textbf{inspiziert} werden können (die Regeln sind in einer formalen
Sprache geschrieben – Scheme, Pascal, Lisp)
\item \textbf{zurückverfolgt} werden können (jeder Generierungsschritt kann
auf eine Regel zurückgeführt werden)
\item \textbf{falsifiziert} werden können (ein Gegenbeispiel kann eine
Regel widerlegen)
\item \textbf{kommuniziert} werden können (die Regeln können mit anderen
Forschern geteilt, diskutiert und kritisiert werden)
\end{enumerate}
\subsection{Die Cargo-Kult-Kritik}
Das Original-Notebook enthält einen provokativen Passus:
\blockquote{Wenn man ein Lehrbuch über die Regeln von Verkaufsgesprächen
schreiben will, aber einen Softwareagenten erhält, der gerne Verkaufsgespräche
führt, hat man auf sehr hohem Niveau schlechte Arbeit gemacht.}
Diese Kritik ist nicht anti-KI. Sie warnt vor \textbf{Kategorienfehlern}:
Ein Werkzeug, das für einen Zweck entwickelt wurde (statistische Simulation),
für ein anderes Problem zu verwenden (explikative Rekonstruktion). Ein LLM ist
ein ausgezeichneter Simulator, aber ein schlechter Erklärer. Die ARS ist ein
ausgezeichneter Erklärer, aber ein weniger skalierbarer Simulator. Diese
Komplementarität zu erkennen, ist der erste Schritt zu einer methodologisch
soliden Integration.
\section{Hin zu einer methodologischen Synthese}
\subsection{Komplementarität statt Konkurrenz}
Die obige Analyse legt eine Arbeitsteilung nahe:
\begin{itemize}
\item \textbf{LLMs für Skalierung} nutzen: Neuronale Mustererkennung kann
erste Kategoriezuordnungen vorschlagen, Kandidatenmuster identifizieren
und große Korpora verarbeiten.
\item \textbf{ARS für Validierung} nutzen: Die symbolische Grammatik kann
die Wohlgeformtheit neuronaler Vorschläge prüfen, interpretative
Entscheidungen dokumentieren und Erklärungen liefern.
\item \textbf{Den Menschen in der Schleife behalten}: Die endgültige
Validierungs- und Interpretationsautorität verbleibt beim menschlichen
Forscher.
\end{itemize}
Dies ist genau der Ansatz, der später als \textbf{CGTI (Computational Grounded
Theory Integration)} und \textbf{AQSA (Adversarial Qualitative Sequence
Analysis)} formalisiert wurde.
\subsection{Lehren für die zeitgenössische neuro-symbolische KI}
Aus der ARS-Erfahrung kann die zeitgenössische neuro-symbolische Forschung
lernen:
\begin{enumerate}
\item \textbf{Erklärbarkeit durch Design}: Symbolische Komponenten sollten
von Grund auf interpretierbar sein, nicht als nachträgliche Ergänzungen.
\item \textbf{Mehrere Formalismen}: Unterschiedliche Aufgaben (Induktion,
Parsing, Generierung) können unterschiedliche formale Sprachen erfordern.
Scheme, Pascal und Lisp dienten jeweils einem eigenen Zweck.
\item \textbf{Methodologische Kontrolle vor Skalierung}: Ein kleines, gut
verstandenes Korpus (8 Transkripte) bietet mehr methodologische Einsicht
als ein großes, opakes Korpus.
\item \textbf{Der Mensch als System 1}: In manchen Kontexten ist menschliche
Mustererkennung neuronalen Netzen überlegen – nicht weil sie schneller ist,
sondern weil sie interpretierbar ist und kommuniziert werden kann.
\end{enumerate}
\section{Fazit}
Dieser Beitrag hat drei frühe Implementierungen der Algorithmisch Rekursiven
Sequenzanalyse (ARS) rekonstruiert – einen Induktor in Scheme, einen Parser
in Pascal und einen Transduktor in Lisp – und sie mit einem großen Sprachmodell
kontrastiert, das auf demselben Korpus trainiert wurde. Ich habe argumentiert,
dass:
\begin{enumerate}
\item Die ARS eine \textbf{proto-neuro-symbolische} Methodologie darstellt,
die zentrale Anliegen der zeitgenössischen neuro-symbolischen KI um
Jahrzehnte antizipiert.
\item Die drei Komponenten (Induktor, Parser, Transduktor) komplementäre
Funktionen adressieren: Symbolabstraktion, strukturelle Validierung und
generative Regelanwendung.
\item Im Gegensatz zu LLMs, die statistische Verteilungen ohne Erklärung
simulieren, produziert die ARS \textbf{explizite, falsifizierbare und
intersubjektiv prüfbare Grammatiken}.
\item Die ARS die XAI-Kriterien der Verständlichkeit, Genauigkeit und
Wissensgrenzen auf Weisen erfüllt, die rein neuronale Modelle nicht können.
\end{enumerate}
Der historische Record zeigt, dass die Herausforderungen der neuro-symbolischen
Integration lange vor der aktuellen Forschungswelle erkannt und bearbeitet
wurden. Die ARS bietet eine methodologische Vorlage, die zeitgenössische
Forscher gut daran täten zu studieren – nicht als historisches Artefakt, sondern
als lebendigen Ansatz für \textbf{erklärbare, kontrollierte und verifizierbare}
Sequenzanalyse.
Die Frage für die neuro-symbolische KI ist nicht, ob Mustererkennung mit
regelbasiertem Schließen integriert werden soll. Die Frage ist, wie dies ohne
Aufgabe der methodologischen Standards geschehen kann, die wissenschaftliche
Erkenntnis erst möglich machen. Die ARS gibt eine Antwort.
\newpage
\begin{thebibliography}{99}
\bibitem[Garcez \& Lamb(2020)]{garcez2020neurosymbolic}
Garcez, A. d'Avila, \& Lamb, L. C. (2020). Neurosymbolic AI: The 3rd wave.
\textit{arXiv preprint arXiv:2012.05876}.
\bibitem[Hitzler \& Sarker(2022)]{hitzler2022neuro}
Hitzler, P., \& Sarker, M. K. (Hrsg.). (2022). \textit{Neuro-Symbolic Artificial
Intelligence: The State of the Art}. IOS Press.
\bibitem[Kautz(2020)]{kautz2020third}
Kautz, H. (2020). The third AI summer: AAAI Robert S. Engelmore Memorial Award
Lecture. \textit{AI Magazine}, 43(1), 93-104.
\bibitem[Koop(1992)]{koop1992parser}
Koop, P. (1992). \textit{Demo-Parser Chart-Parser Version 1.0}. Pascal-Quellcode.
\bibitem[Koop(1994)]{koop1994scheme}
Koop, P. (1994). \textit{Grammatikinduktion empirisch gesicherter
Verkaufsgespräche}. Scheme-Quellcode.
\bibitem[Koop(1994)]{koop1994lisp}
Koop, P. (1994). \textit{Sequenzanalyse empirisch gesicherter
Verkaufsgespräche}. Lisp-Quellcode.
\bibitem[Koop(2023)]{koop2023notebook}
Koop, P. (2023). \textit{Qualitative Sozialforschung und Große Sprachmodelle}.
Jupyter Notebook.
\bibitem[Oevermann et al.(1979)]{oevermann1979methodology}
Oevermann, U., Allert, T., Konau, E., \& Krambeck, J. (1979). Die Methodologie
einer objektiven Hermeneutik. In H.-G. Soeffner (Hrsg.), \textit{Interpretative
Verfahren in den Sozial- und Textwissenschaften} (S. 352-434). Metzler.
\bibitem[Ortigossa et al.(2024)]{ortigossa2024xai}
Ortigossa, E. S., Gonçalves, T., \& Nonato, L. G. (2024). Explainable Artificial
Intelligence (XAI)—From Theory to Methods and Applications. \textit{IEEE Access},
12, 80799-80846.
\bibitem[Trask(2020)]{trask2020neural}
Trask, A. W. (2020). \textit{Neuronale Netze und Deep Learning kapieren: Der
einfache Praxiseinstieg mit Beispielen in Python}. dpunkt.
\end{thebibliography}
\end{document}