Erweiterte Intelligenz: Wenn 1 + 1 in der Forschungsarbeit…

Erweiterte Intelligenz: Wenn 1 + 1 in der Forschungsarbeit mehr ergibt

Der Begriff „erweiterte Intelligenz“ taucht heute häufiger auf als „künstliche Intelligenz“ in den strategischen Dokumenten vieler Forschungsinstitute. Nicht ohne Grund. Die Erzählung, dass KI den Wissenschaftler ersetzen wird, hat sich in der Praxis als wenig nützlich erwiesen. Die Frage jedoch, wie Forscher und Modell effektiver zusammenarbeiten können als jedes für sich, eröffnet konkrete Möglichkeiten. Bei Cashcrown beobachten wir dies in Projekten, in denen wir KI-Systeme in analytische Prozesse von Unternehmen integrieren. Das Muster ist wiederholbar: Dort, wo der Mensch die Kontrolle über die Interpretation behält und das Modell die Verarbeitung großer Datenmengen übernimmt, sind die Ergebnisse messbar. Dort, wo die Verantwortungsgrenze verschwimmt, treten Probleme auf.

Was jede Seite zur Zusammenarbeit beiträgt

Bevor wir Synergien bewerten, lohnt es sich, die Asymmetrie der Fähigkeiten zu benennen.

Das KI-Modell ist schnell und unermüdlich bei iterativen Aufgaben. Die Durchsuchung mehrerer tausend Abstracts, die Extraktion strukturierter Daten daraus, der Vergleich von Ergebnissen zwischen Forschungsdatensätzen, die Generierung einer Liste von Hypothesen-Kandidaten basierend auf erkannten Korrelationen. Die Zeit, die Wochen manueller Arbeit in Anspruch nehmen würde, verkürzt sich auf Stunden. Das ist keine Übertreibung, sondern eine Beobachtung aus konkreten Implementierungen in analytischen Projekten.

Der Forscher bringt das ein, was das Modell nicht hat. Ein Verständnis des Fachkontexts, das über die Trainingsdaten hinausgeht. Intuition darüber, welche Korrelationen zufällig sein könnten und welche mechanistisch begründet sind. Die Fähigkeit, ein Experiment zu entwerfen, das die Hypothese unter realen Bedingungen überprüft. Ethische Verantwortung für Schlussfolgerungen, die in Publikationen oder Entscheidungen einfließen.

Probleme entstehen, wenn eine dieser Annahmen nicht mehr zutrifft: Das Modell halluziniert Zitate, und der Forscher überprüft sie nicht. Oder der Forscher ist so überlastet, dass er die Ergebnisse des Modells ohne kritische Bewertung akzeptiert. Beide Szenarien haben dieselbe Ursache: das Fehlen eines entworfenen Kontrollpunkts.

Aufgaben, bei denen Synergie dokumentiert ist

Nicht jede Forschungsaufgabe profitiert gleichermaßen von der Einbindung von KI. Die folgende Tabelle ordnet Aufgaben nach dem beobachteten Effizienzgewinn und dem Risiko, das der Mensch überwachen muss.

Forschungsaufgabe	Rolle des KI-Modells	Entscheidung durch den Forscher	Hauptrisiko
Literaturrecherche und -synthese	Zusammenfassung, Identifizierung von Lücken, Aufzeigen von Widersprüchen	Auswahl der Quellen für vertiefte Analyse	Halluzinationen von Zitaten
Datenextraktion aus Berichten und PDFs	Strukturierung von Daten, OCR, Feldzuordnung	Validierung einer repräsentativen Stichprobe	Extraktionsfehler in nicht standardisierten Formaten
Generierung von Hypothesen-Kandidaten	Vorschläge basierend auf Mustern in den Daten	Bewertung der biologischen/methodologischen Glaubwürdigkeit	Korrelationen ohne kausalen Mechanismus
Automatische qualitative Kodierung	Zuweisung von Kategorien, Erkennung von Themen	Überprüfung der Übereinstimmung mit dem theoretischen Rahmen	Kategorien-Drift gegenüber den Annahmen
Synthese eines Manuskript-Entwurfs	Erste Version der Abschnitte Methods/Results	Vollständige Überprüfung jeder Aussage vor dem Einreichen	Wiederholungen aus Trainingsdaten statt eigener Ergebnisse

Jede Zelle in der Spalte „Entscheidung durch den Forscher“ ist ein Punkt, an dem human-oversight architektonisch erforderlich und nicht optional ist.

Wo die Synergie versagt

Erweiterte Intelligenz funktioniert nicht von selbst. Drei Ausfallmuster, die wir am häufigsten beobachten:

Automation Bias. Der Forscher sieht ein sicher formuliertes Ergebnis des Modells und hinterfragt es nicht, weil es kompetent klingt. Das LLM generiert Antworten mit ähnlicher Selbstsicherheit, unabhängig davon, ob das Thema gut in den Trainingsdaten abgedeckt ist oder an der Grenze seines Wissens liegt. Ohne ein explizites Unsicherheitssignal (confidence score, Warnung vor distributional shift) hat der Forscher keine Grundlage zur Unterscheidung.

Unsichtbare Datenverzerrung. Ein auf bisheriger Literatur trainiertes Modell reproduziert deren Fehler als Fakten. Überrepräsentation bestimmter Populationen in klinischen Studien, publication bias (positive Ergebnisse werden häufiger veröffentlicht als negative), geografische Konzentration der Quellen. Eine detaillierte Betrachtung dieses Problems findest du im Artikel über algorithmische Verzerrung.

Verschwommene Verantwortung. Wenn niemand für die Überprüfung einer bestimmten Aussage verantwortlich ist, geht jeder davon aus, dass es jemand anderes tut. Im Kontext wissenschaftlicher Publikationen bedeutet dies, dass ein Fehler des Modells in das Manuskript gelangen kann, weil „das KI generiert hat“. Die Richtlinien von ICMJE, Nature und Science sind eindeutig: Der Forscher, der die Arbeit unterzeichnet, ist für jede Aussage verantwortlich, unabhängig vom verwendeten Werkzeug. Mehr dazu, wie KI die Rolle des Forschers verändert, beschreiben wir im Artikel die Zukunft der wissenschaftlichen Arbeit.

Wie man Kontrollpunkte gestaltet

Bei Cashcrown wenden wir bei der Entwicklung analytischer Agenten für Kunden ein Muster aus drei Arten von Kontrollpunkten an. Dasselbe Muster ist in Forschungsumgebungen sinnvoll.

Sperrpunkt (hard gate). Eine nicht umkehrbare Aktion kann nicht ohne explizite Bestätigung durch den Menschen erfolgen. In der Forschung: Genehmigung des experimentellen Protokolls vor dem Start, Zustimmung des Projektleiters vor dem Einreichen des Manuskripts zur Begutachtung. Das KI-Agent-System kann diese Grenze nicht eigenständig überschreiten.

Stichprobenprüfpunkt (soft gate). Der Mensch überprüft eine zufällige Stichprobe der Modellergebnisse, nicht alles. Wird bei der Datenextraktion aus unstrukturierten Quellen angewendet, wo die manuelle Überprüfung jeder Zeile unpraktikabel ist. Die Stichprobe sollte statistisch repräsentativ sein, und das Ergebnis der Überprüfung sollte dokumentiert werden.

Anomalie-Flagging-Punkt (alert gate). Das System meldet, wenn es auf Daten außerhalb seines typischen Betriebsbereichs stößt: distributional shift, sehr niedriger confidence score, Widerspruch zu früheren Ergebnissen. Dies ist eine Aufgabe für die Observability des KI-Systems. Der Forscher reagiert auf die Meldung, überprüft nicht routinemäßig alles.

Die Formalisierung dieser Punkte verlangsamt die Arbeit nicht. Sie beseitigt Unsicherheit darüber, wer wofür verantwortlich ist und wann.

Die Rolle der Erklärbarkeit in der wissenschaftlichen Umgebung

Wissenschaft erfordert Falsifizierbarkeit. Wenn das Ergebnis eines Modells nicht erklärbar ist, kann kein Experiment entworfen werden, das es überprüft. Dies unterscheidet den Forschungskontext von vielen anderen Anwendungen von KI.

Explainability in Forschungssystemen hat mehrere Ebenen:

Hinweis auf die Eingabedatenfragmente, die den größten Einfluss auf das Ergebnis hatten (attention maps, saliency). Dies ist keine vollständige kausale Begründung, aber ein Ausgangspunkt für die Überprüfung. Begründung in natürlicher Sprache: „Diese Merkmalskombination korreliert in X% der analogen Fälle im Trainingsdatensatz mit dem Ergebnis.“ Konfidenzintervall und Information über distributional shift: Das Modell gibt an, dass es unsicher ist, bevor der Forscher fragt.

Systeme ohne diese Ebenen sind in der Forschungsumgebung ein höheres Risiko, da sie Ergebnisse ohne Mechanismus zur Infragestellung liefern.

Live ausprobieren

▶Gestalte Kontrollpunkte für ein KI-gestütztes Forschungsprojektsandbox · reasoning

FAQ

Worin unterscheidet sich erweiterte Intelligenz von autonomer KI in der Wissenschaft?

Erweiterte Intelligenz geht davon aus, dass der Mensch in jeder entscheidenden Phase in den Entscheidungsprozess eingebunden bleibt. KI beschleunigt die Verarbeitung und Generierung von Kandidaten, aber der Forscher genehmigt Hypothesen, Protokolle und Aussagen, bevor sie festgehalten werden. Ein autonomes KI-System versucht, den Prozess ohne menschliches Zutun abzuschließen. Im wissenschaftlichen Kontext ist Autonomie in engen, wiederholbaren Aufgaben möglich (z. B. Screening von chemischen Verbindungen in silico), aber die experimentelle Überprüfung und die Verantwortung für Schlussfolgerungen bleiben immer beim Menschen. Eine detaillierte Diskussion der Grenzen der Autonomie findest du im Artikel KI als autonomer Wissenschaftler.

Wie verhindert man, dass das Modell falsche Zitate generiert?

Drei Schutzebenen, die zusammen angewendet werden, bieten eine gute Wirksamkeit. Erste: Verwende Modelle mit Zugang zu einer Literaturdatenbank (RAG auf einem Index von PubMed, Semantic Scholar oder einem eigenen Korpus), nicht generative Modelle ohne Kontext. Zweite: Fordere vom Modell immer die Angabe eines vollständigen bibliografischen Identifikators (DOI oder PMID), der automatisch überprüft werden kann. Dritte: Bevor ein Zitat in das Manuskript aufgenommen wird, überprüft ein Mitarbeiter oder Skript, ob der Datensatz existiert und ob der zitierte Text mit dem Original übereinstimmt. Mehr über den Mechanismus der Entstehung von Halluzinationen: Wie man KI-Halluzinationen begrenzt.

Können von KI generierte Ergebnisse im Abschnitt Methods berücksichtigt werden?

Ja, aber mit vollständiger Beschreibung. Die wichtigsten Verlage (Nature, Science, ICMJE) verlangen eine Erklärung im Abschnitt Methods, welche Schritte durch KI unterstützt wurden und welches Werkzeug (Name, Version, Datum) verwendet wurde. Das Fehlen dieser Erklärung bei der Nutzung von KI kann als Verstoß gegen die wissenschaftliche Integrität gewertet werden. Praktisch bedeutet dies, dass ein Protokoll der Prompts und Modellergebnisse als Teil der Forschungsdokumentation geführt wird, analog zum Geräteprotokoll.

Wie wirkt sich der AI Act auf KI-Systeme in der wissenschaftlichen Forschung aus?

Der AI Act verbietet KI in der Wissenschaft nicht, klassifiziert jedoch Systeme, die Entscheidungen in medizinischen, regulatorischen oder sicherheitsrelevanten Bereichen beeinflussen, als hochriskant. Solche Systeme erfordern ein Register, eine Konformitätsbewertung und technische Dokumentation. Systeme, die ausschließlich zur Vorauswahl von Literatur oder Generierung von Hypothesen verwendet werden und keine direkten Entscheidungen mit hohem Risiko beeinflussen, unterliegen weniger strengen Anforderungen. Die zentrale Frage lautet: Ist das Ergebnis des KI-Systems die direkte Grundlage für eine Entscheidung, die Menschen betrifft? Wenn ja, steigen die Anforderungen.

Können kleine Forschungsteams ein Modell der erweiterten Intelligenz effektiv implementieren?

Ja, und sie profitieren oft proportional mehr als große Institutionen mit ausgebauter Infrastruktur. Ein RAG-Assistent für den eigenen Fachliteraturkorpus, ein Skript zur Datenextraktion aus PDF-Berichten, automatische Zusammenfassungen neuer Publikationen zu einem bestimmten Thema. Jedes dieser Tools ist ohne IT-Abteilung verfügbar. Entscheidend ist, von Anfang an Kontrollpunkte zu entwerfen, bevor sich Gewohnheiten der Arbeit mit KI ohne diese verfestigen. Die Rolle des Menschen im Loop beschreibt, wie man diese Gewohnheiten in der Praxis aufbaut.

Verwandte FallstudiedowodyIO — Akten zu prüfbarem Beweismaterial