AI und Theory of Mind: Versteht eine Maschine die Absichten…

AI und Theory of Mind: Versteht eine Maschine die Absichten eines Wissenschaftlers?

Wenn ein Forscher einem KI-Assistenten eine Frage zum Wirkmechanismus eines Enzyms stellt, antwortet das Modell auf Basis statistischer Muster in Milliarden von Tokens wissenschaftlicher Texte. Doch versteht es, dass die Frage aus Frustration über ein gescheitertes Experiment stammt? Dass nicht nur eine Definition gesucht wird, sondern ein Ansatzpunkt für eine neue Hypothese? Diese Unterscheidung hat praktische Konsequenzen für jeden, der KI-Systeme zur Unterstützung der Forschungsarbeit entwirft.

Was ist die Theory of Mind und warum besitzt KI sie nicht?

Die Theory of Mind (ToM) ist die Fähigkeit, anderen Menschen mentale Zustände zuzuschreiben: Überzeugungen, Absichten, Wünsche, Wissen. Kinder erwerben sie zwischen dem dritten und fünften Lebensjahr. Dank ihr wissen wir, dass ein Kollege nicht lügt, sondern etwas einfach nicht weiß.

Sprachmodelle besitzen diese Fähigkeit nicht im mechanistischen Sinne. Ihre Architektur basiert auf der Vorhersage des nächsten Tokens auf Basis des Kontexts, nicht auf der Repräsentation innerer Zustände des Gesprächspartners. Studien aus den Jahren 2023 und 2024 zeigen, dass LLM einige klassische ToM-Tests wie die Aufgabe des falschen Glaubens bestehen können, dies jedoch auf Mustern in den Trainingsdaten beruht – nicht auf einer tatsächlichen Modellierung des Geistes des Gesprächspartners. Wird der Test auch nur leicht umformuliert, sinkt die Erfolgsrate deutlich.

Für die Forschungsarbeit ist dies der Unterschied zwischen einem Werkzeug, das eine Frage wörtlich beantwortet, und einem Assistenten, der den Kontext hinter der Frage versteht.

Was erkennt KI tatsächlich aus der Frage eines Forschers?

Auch ohne Theory of Mind hat das Modell einen realen Nutzen bei der Interpretation von Absichten. Es lohnt sich, zu unterscheiden, was funktioniert und was nicht.

Was zuverlässig funktioniert. Das Modell leitet Absichten aus lexikalischen und strukturellen Signalen ab: Schlüsselwörtern, grammatikalischen Modi, Länge der Frage, Vorhandensein vorheriger Austausche im Kontextfenster. Wenn ein Forscher „welche Mechanismen erklären X“ schreibt, erkennt das Modell eine erklärende Frage und antwortet anders als auf „wie misst man X“. Für gut beschriebene Absichten (Literaturrecherche, Synthese, Methodenvergleich) ist die Trefferquote hoch.

Was nicht funktioniert. Das Modell erkennt keine Emotionen, Frustrationsniveaus, versteckte Annahmen oder die Projektgeschichte – es sei denn, der Forscher hat sie explizit in den Prompt geschrieben. Es weiß nicht, dass der Forscher gerade die dritte Hypothese in Folge verworfen hat und etwas anderes sucht. Es modelliert nicht, dass die Frage aus einem Bereich stammt, in dem der Forscher Experte ist, und dass eine Antwort auf Einführungsniveau nutzlos ist.

Bei Cashcrown beobachten wir bei der Entwicklung von RAG-Assistenten für Kunden aus dem F&E-Bereich regelmäßig dieses Muster: Das Modell antwortet präzise auf die wörtliche Frage, verfehlt jedoch die Absicht des Forschers, wenn diese nicht explizit im Prompt ausgedrückt wurde.

Konsequenzen für das Design von Forschungssystemen

Das Fehlen von ToM in KI macht sie nicht nutzlos für die Wissenschaft. Es verändert jedoch die Architektur des Systems, das wir aufbauen wollen.

Systemelement	Ohne Berücksichtigung des Fehlens von ToM	Mit Berücksichtigung des Fehlens von ToM
Frageninterface	Ein Textfeld	Strukturierter Fragebogen: Ziel, Kontext, Einschränkungen
Ergebnisinterpretation	Modell interpretiert selbst	Forscher überprüft die Trefferquote der Absicht vor Nutzung
Iteration	Eine Antwort	Mehrere Varianten der Frageinterpretation zur Auswahl
Dokumentation	Keine	Log der Prompts und Absichten als Teil der Forschungsdokumentation

Beim Entwurf eines Systems, das die wissenschaftliche Arbeit unterstützen soll, lohnt es sich, einen Mechanismus einzubauen, bei dem das Modell die verstandene Absicht vor der Antwort explizit paraphrasiert. Dies ist ein einfaches Muster, das die Diskrepanz zwischen dem, was der Forscher wissen wollte, und dem, was das Modell als Frage interpretiert hat, dramatisch reduziert.

Live ausprobieren

▶Modell paraphrasiert die Absicht einer Forschungsfragesandbox · reasoning

Halluzinationen von Absichten: Wenn das Modell zu viel „errät“

Halluzinationen im Kontext der Theory of Mind nehmen eine besondere Form an. Statt zu antworten „Ich weiß nicht, was du meinst“, konstruiert das Modell manchmal eine Antwort basierend auf einer unterstellten Absicht, die in der Frage nicht enthalten war.

Ein Praxisbeispiel: Ein Forscher fragt nach einem „Protokoll zur RNA-Isolierung aus FFPE-Proben“. Das Modell antwortet zu Standardprotokollen, ohne zu signalisieren, dass für FFPE-Proben, die älter als drei Jahre sind, ein spezialisiertes Verfahren zur Reparatur von Fragmentierungen existiert. Ohne zu wissen, dass der Forscher mit alten Archivgeweben arbeitet, überspringt das Modell eine entscheidende Information – nicht aus Boshaftigkeit, sondern weil es keine Kontextdaten hatte.

Explainability in solchen Systemen bedeutet nicht nur zu erklären, woher die Antwort stammt, sondern auch explizit zu signalisieren, welche Annahmen das Modell über die Absicht des Fragestellers getroffen hat. Ohne dies weiß der Forscher nicht, was die Antwort nicht umfasst.

Human-Oversight: Wo der Mensch in die Schleife eingreifen muss

Das Fehlen der Theory of Mind wirkt sich direkt auf die Anforderungen an Human-Oversight in Forschungssystemen aus. Es handelt sich dabei nicht um übertriebene Vorsicht, sondern um eine Konsequenz der Modellarchitektur.

Drei Punkte, an denen die Intervention des Forschers obligatorisch ist:

Erstens die Überprüfung der Trefferquote der Absicht nach der ersten Antwort des Modells. Der Forscher bewertet, ob das Modell die gestellte Frage beantwortet hat oder eine Frage, die das Modell interpretiert hat. Das dauert einen Moment, eliminiert aber Stunden Arbeit in die falsche Richtung.

Zweitens die Akzeptanz der Hypothese vor dem Experiment. LLM als Hypothesengenerator kann Dutzende Kandidaten vorschlagen, aber die Auswahl für das Experiment erfordert eine biologische, chemische oder fachspezifische Expertise. Das Modell weiß nicht, welche Hypothesen mit den verfügbaren Laborressourcen experimentell umsetzbar sind.

Drittens die Validierung vor der Aufnahme in das Manuskript. Jede von KI generierte Aussage, die in eine Publikation einfließt, muss vom Forscher mit Angabe der Primärquelle verifiziert werden – nicht nur des Modelloutputs.

Das bei Cashcrown verwendete Human-Gate-Muster für Agenten funktioniert nach genau diesem Prinzip: Jede nicht umkehrbare Aktion erfordert eine explizite Bestätigung. In der Forschung entspricht dies der Genehmigung des Protokolls vor dem Start des Experiments.

Was sich ändert, wenn KI Kontext besser interpretiert

Die Entwicklungsrichtung von Modellen in den Jahren 2025 und 2026 umfasst längere Kontextfenster, bessere Handhabung mehrstufiger Anweisungen und explizite Parametrisierung der Nutzerrolle im Systemprompt. Dies bringt Modelle einer nützlicheren Interpretation von Absichten näher – auch ohne Theory of Mind im kognitiven Sinne.

Praktische Implikationen für Forschungssysteme:

Ein Systemprompt mit Beschreibung der Rolle des Forschers (Fachgebiet, Expertiselevel, Projektkontext) verbessert die Trefferquote der Antworten deutlich mehr als ein Modellwechsel.
Ein mehrstufiger Dialog, bei dem das Modell im ersten Schritt die Absicht paraphrasiert und auf Korrektur wartet, funktioniert besser als eine einstufige Abfrage.
Die Integration mit einem Wissensmanagementsystem des Projekts (Notizen, vorherige Experimente, verworfene Hypothesen) durch semantische Suche (RAG) kompensiert teilweise das Fehlen eines kontextuellen Gedächtnisses des Modells über die Projektgeschichte.

Jede dieser Lösungen reduziert die Absichtslücke, ohne zu verlangen, dass das Modell den Wissenschaftler im menschlichen Sinne „versteht“. Dies ist eine realistische Entwicklungsrichtung für 2026 und 2027 – im Gegensatz zu Spekulationen über Maschinen mit echter Theory of Mind.

FAQ

Werden LLM irgendwann klassische Theory-of-Mind-Tests bestehen?

Einige Modelle erreichen bereits heute hohe Ergebnisse in Standard-ToM-Tests wie der Aufgabe des falschen Glaubens. Studien zeigen jedoch, dass dies auf dem Auswendiglernen von Mustern aus Trainingsdaten beruht – nicht auf einer echten Modellierung mentaler Zustände. Eine kleine Modifikation des Tests kann zu einem deutlichen Trefferquotenabfall führen. Die Interpretation des „Bestehens des Tests“ als Beweis für den Besitz von ToM ist methodisch fehlerhaft.

Wie gestaltet man einen Prompt, damit das Modell die Absicht der Frage besser erkennt?

Der effektivste Ansatz ist die explizite Beschreibung des Fragekontexts: Fachgebiet, Ziel, Einschränkungen, erwartetes Antwortniveau. Statt „welche Mechanismen erklären X“ ist es besser zu schreiben: „Ich bin Biochemiker und arbeite an Kinasehemmern. Ich suche Mechanismen, die die Variabilität in Proliferationsmessungen erklären, auf dem Niveau eines Übersichtsartikels.“ Das Modell beantwortet die wörtliche Frage – je wörtlicher die Absicht beschrieben ist, desto treffender die Antwort.

Stellt das Fehlen der Theory of Mind in KI ein ethisches Problem in der Forschung dar?

Im Kontext der wissenschaftlichen Forschung ist dies kein direktes ethisches, sondern ein architektonisches Problem. Das Modell interpretiert nicht die Absicht des Forschers, was bedeutet, dass der Forscher explizit überprüfen muss, ob die Antwort des Modells auf die beabsichtigte Frage eingeht. Der ethische Aspekt entsteht, wenn Ergebnisse des Modells ohne diese Überprüfung in Publikationen einfließen, was gegen Standards der Reproduzierbarkeit und wissenschaftlichen Verantwortung verstößt.

Wie hilft ein RAG-System, das Fehlen der Theory of Mind zu kompensieren?

Semantische Suche (RAG) liefert dem Modell projektspezifischen Kontext: frühere experimentelle Ergebnisse, verworfene Hypothesen, Notizen des Forschers. Dies beseitigt nicht das Fehlen von ToM, reduziert aber die häufigste Ursache für Absichtsdiskrepanzen: Das Modell wusste nicht, was der Forscher bereits versucht hat. Bei einem gut gestalteten Projektwissensindex verfügt das Modell über ausreichend Kontext, um auf die Frage des Forschers zu antworten – nicht auf eine allgemeine Frage.

Wie reguliert der AI Act Systeme, die Nutzerabsichten in der Forschung interpretieren?

Der AI Act definiert keine separate Kategorie für Systeme, die Absichten interpretieren, aber KI-Systeme, die in der Forschung eingesetzt werden und medizinische, regulatorische oder sicherheitsrelevante Entscheidungen beeinflussen, unterliegen den Anforderungen für Hochrisikosysteme: Register, technische Dokumentation, Konformitätsbewertung, Überwachung nach der Implementierung. Systeme, die die Literaturrecherche oder vorläufige Synthese unterstützen und keine direkten Hochrisikoentscheidungen beeinflussen, haben weniger strenge Anforderungen.

Die Themen Erklärbarkeit von KI-Systemen, die Rolle des Menschen in der Entscheidungsschleife und Autonomie von KI in der Wissenschaft sind direkt mit der Frage nach der Theory of Mind verknüpft. Wenn Sie ein forschungsbasiertes KI-System entwerfen, hilft Ihnen das Tool zur Bewertung der Einsatzbereitschaft, Architekturlücken zu identifizieren, bevor Sie in der Produktion auf Absichtsprobleme stoßen.

Verwandte FallstudiedowodyIO — Akten zu prüfbarem Beweismaterial