Diese Frage kommt bei jeder Implementierung auf: „Und was, wenn die KI anfängt, vor dem Kunden zu erfinden?“. Zu Recht — ein Modell ohne Schutzmaßnahmen kann mit voller Überzeugung eine nicht existierende Nummer, einen Preis oder ein Datum nennen. Halluzinationen lassen sich nicht auf null reduzieren, aber man kann sie auf ein Niveau bringen, auf dem das System vertrauenswürdig ist.
Warum das Modell erfindet
#Ein Sprachmodell sagt nächste Token auf Basis von Sprachstatistik voraus — es kennt Ihre Daten nicht und weiß nicht, was es nicht weiß. Fehlt ihm ein Fakt, füllt es die Lücke mit Text, der wahrscheinlich klingt. Das ist kein „böswilliger“ Fehler, sondern die Natur der Vorhersage.
Drei Verteidigungsebenen
#Halluzinationen begrenzen wir schichtweise — nicht mit einem Trick, sondern mit einem Pipeline:
- RAG mit Zitierung — das Modell antwortet nicht „aus dem Kopf“, sondern auf Basis gefundener Ausschnitte Ihres Wissens und gibt die Quelle an. Was sich überprüfen lässt, dem kann man vertrauen.
- Vertrauensschwelle — wenn die Suche keine gute Übereinstimmung findet, rät das System nicht: Es sagt „weiß ich nicht“ und eskaliert zum Menschen.
- Guardrails am Ausgang — Barrieren qualifizieren riskante Inhalte: Preise werden als Spanne angegeben, Termine mit Vorbehalt, keine Versprechen, die nicht gegeben werden dürfen.
RAG vs. reines Modell
#| Kriterium | Reines Modell | RAG mit Zitierung |
|---|---|---|
| Antwortquelle | „Gedächtnis“ des Modells | Ihre Dokumente |
| Zitierfähigkeit | nein | ja |
| Aktualität | Trainingsdatum | laufend |
| Verhalten bei Wissenslücken | erfindet | sagt „weiß ich nicht“ |
| Halluzinationsrisiko | hoch | niedrig |
Deshalb wählen wir für den Unternehmensassistenten immer RAG und nicht nur einen Prompt für das Modell — den Unterschied beschreiben wir auch im Beitrag RAG oder Fine-Tuning.
„Weiß ich nicht“ ist ein Feature, kein Fehler
#Die wichtigste mentale Veränderung: Ein guter KI-Assistent sagt öfter „weiß ich nicht“ als ein schlechter. Die Vertrauensschwelle und Eskalation zum Menschen sind keine Einschränkung — sie sorgen dafür, dass den Antworten vertraut werden kann. Ein System, das immer eine Antwort hat, ist ein System, das sie manchmal erfindet.
Live ausprobieren
#Der Kern der Abwehr besteht darin, aus konkretem Text zu antworten, nicht aus Vermutungen. Fügen Sie einen Ausschnitt ein und bitten Sie um eine Zusammenfassung — das Modell hält sich an den Inhalt (Playground: PII maskiert, keine Speicherung):
FAQ
#Lassen sich Halluzinationen vollständig eliminieren?
#Nicht auf null — das liegt in der Natur von Sprachmodellen. Aber man kann sie auf ein vertrauenswürdiges Niveau bringen: RAG mit Zitierung basiert die Antwort auf Fakten, die Vertrauensschwelle erzwingt „weiß ich nicht“ bei schwacher Übereinstimmung, und Guardrails blockieren riskante Versprechen. Entscheidend ist, diese Ebenen von Anfang an zu designen, nicht sie später anzufügen.
Woher weiß ich, dass die Antwort nicht erfunden ist?
#Am Zitat. In einem gut aufgebauten RAG verweist jede Antwort auf eine Quelle aus Ihrer Datenbank, sodass sie überprüfbar ist. Kein Zitat oder geringe Sicherheit sind ein Signal, dass das System zum Menschen eskalieren sollte, statt zu antworten.
Halluziniert ein größeres Modell weniger?
#Ein wenig, aber das ist keine Lösung. Selbst das stärkste Modell erfindet, wenn es den Fakt nicht kennt und keinen Zugang zu Quellen hat. Die Architektur (RAG + Zitierung + Vertrauensschwelle) begrenzt Halluzinationen effektiver als die bloße Vergrößerung des Modells.