Die KYC-Abteilung eines Fintech-Unternehmens bearbeitet monatlich fünftausend Onboardings. Jeder Kunde sendet einen Personalausweis, eine Adressbestätigung und einen Kontoauszug in verschiedenen Formaten, mit unterschiedlicher Scanqualität, manchmal ein Foto vom Handy aus ungünstigem Winkel. Jemand öffnet all diese Unterlagen, prüft sie, überträgt die Daten in das CRM-System und entscheidet, ob das Dokument ausreichend lesbar ist, um fortzufahren. Bei fünftausend Fällen pro Monat sind das mehrere Dutzend Arbeitsstunden allein für das Abtippen. Und genau hier macht KI messbar Sinn. Das Problem beginnt, wenn jemand „vollautomatisches KYC ohne menschlichen Eingriff“ oder „AML, das Konten selbst sperrt“ verspricht. Das ist ein anderes Gespräch, das Verbraucherrecht, DSGVO und den AI Act berührt. Im Folgenden trennen wir das eine vom anderen, ohne Versprechungen, die in einem regulierten Sektor nicht eingehalten werden können.
KYC und Onboarding: Dokumentenextraktion ohne manuellen Aufwand
#Der erste Bereich, der einen realen Return on Investment bietet, ist die Umwandlung von Identitätsdokumenten, Adressbestätigungen und Kontoauszügen in strukturierte Datensätze. OCR liest Text aus Bildern, und ein Sprachmodell extrahiert konkrete Felder: Vor- und Nachname, Dokumentennummer, Geburtsdatum, Adresse, IBAN-Nummer.
Bei sauberen, standardisierten Dokumenten (Personalausweis mit modernem Layout, Bankausdruck) erreicht eine gut abgestimmte Datenextraktions-Pipeline eine Genauigkeit von über 90 % auf Feldebene. Bei Handyfotos, älteren Dokumenten mit uneinheitlichem Layout oder ausländischen Dokumenten sinkt die Genauigkeit und ist ohne Tests an einer repräsentativen Stichprobe realer Dokumente schwer vorhersehbar. Daher wird nicht davon ausgegangen, dass das extrahierte Geburtsdatum immer korrekt ist: Bei Feldern, die den weiteren Prozess beeinflussen, bestätigt ein Mensch den Wert, und das System zeigt den Dokumentenausschnitt an, aus dem der Wert stammt.
| Dokumententyp | Was KI extrahiert | Erwartete Feldgenauigkeit | Rolle des Menschen |
|---|---|---|---|
| Personalausweis / Reisepass PL | Vorname, Nachname, PESEL, Gültigkeitsdatum | Hoch (meist über 90 %) | Akzeptiert Daten für das Onboarding |
| Adressbestätigung / Rechnung | Adresse, Dokumentendatum | Hoch bei typischen Drucken | Verifiziert Adresse vs. deklariert |
| Kontoauszug | IBAN, Saldo, Umsatzhistorie | Mittel, abhängig von Bank und Format | Bestätigt Übereinstimmung mit Antrag |
| Ausländisches / handschriftliches Dokument | Versuch, Schlüssel felder zu lesen | Niedrig und variabel | Verifiziert manuell strittige Felder |
Wie man die Qualität und Struktur der Quelldaten sicherstellt, damit die Pipeline darauf zugreifen kann, beschreiben wir in Daten-Governance für KI. Die Extraktion von Daten aus Dokumenten in anderen Kontexten behandelt KI zur Dokumentenanalyse.
AML: Transaktionsmonitoring und Anomalieerkennung
#Die Bekämpfung von Geldwäsche ist ein Bereich, in dem KI im Vergleich zu rein regelbasierten Systemen einen echten Unterschied macht. Ein regelbasiertes Muster erfordert, dass jemand im Voraus weiß, welche Schwellenwerte gesucht werden. Ein Anomalie-Modell lernt die Normalverteilung und signalisiert Abweichungen, bevor jemand eine Regel festlegen kann.
Die Architektur, die wir einsetzen, arbeitet in Schichten. Die regelbasierte Schicht fängt einfache Überschreitungen ab (Betrag über dem Limit, Land außerhalb der Whitelist). Die statistische Schicht erkennt die Aufteilung vieler kleiner Transaktionen, die absichtlich unter der Schwelle bleiben. Die modellbasierte Schicht, basierend auf einem Klassifikator, der auf der Transaktionshistorie trainiert wurde, bewertet die Wahrscheinlichkeit verdächtiger Aktivitäten und erzeugt ein Risikosignal mit einer Erklärung, welche Merkmale ausschlaggebend waren. Die detaillierte mehrschichtige Architektur, einschließlich der Frage des Cold Starts, beschreibt KI zur Betrugs- und Anomalieerkennung.
Hier muss laut und deutlich gesagt werden, was in vielen Präsentationen verschwiegen wird: Die False-Positive-Rate in AML ist ein realer operativer Kostenfaktor. Compliance-Analysten verbringen Zeit damit, Alerts zu prüfen, die sich als saubere Transaktionen herausstellen. Typische AML-ML-Systeme erreichen eine Precision von 20-40 %, was bedeutet, dass 60-80 % der Alerts False Positives sind, die manuell abgelehnt werden müssen. Das ist immer noch besser als rein regelbasierte Systeme, die noch mehr False Positives generieren, aber dies sollte bei der Planung der Analystenkapazitäten nicht verschwiegen werden.
Unantastbare Grenze: Die Meldung an die Finanzbehörde (STR/SAR-Bericht), die Kontosperrung und die Transaktionsablehnung sind unumkehrbare Maßnahmen, die eine menschliche Entscheidung mit vollständiger Begründung im Audit-Log erfordern.
Credit Risk: Scoring als Unterstützung, nicht als Urteil
#Die Bewertung der Kreditwürdigkeit ist wahrscheinlich der am stärksten regulierte Bereich für den Einsatz von KI in der Finanzbranche. KI kann hier den Scoring berechnen, Risikosignale zusammenstellen und eine Begründung für den Analysten vorbereiten. Sie darf jedoch nicht eigenständig einen Kredit für eine natürliche Person ablehnen, ohne dass ein Mensch eingreifen kann.
Der Grund ist sowohl rechtlicher als auch praktischer Natur. Rechtlich: Automatisierte Entscheidungen, die rechtliche Auswirkungen auf eine natürliche Person haben, erfordern gemäß Art. 22 DSGVO das Recht auf menschliches Eingreifen. Praktisch: Ein auf historischen Daten trainiertes Modell kann diskriminierende Muster verfestigen, wenn historische Entscheidungen voreingenommen waren (z. B. höhere Ablehnungsquoten für bestimmte demografische Gruppen oder Regionen).
Erklärbarkeit von Entscheidungen ist eine Pflicht, keine Option der Bequemlichkeit. Der Analyst, der einen Antrag genehmigt oder ablehnt, muss verstehen, welche Signale den Scoring nach oben oder unten getrieben haben: SHAP-Werte für Gradient-Boosting-Modelle ermöglichen es, den Beitrag jedes Merkmals zur Bewertung aufzuzeigen. Dies ist auch eine Anforderung des AI Act für Hochrisikosysteme, und Systeme zur Bewertung der Kreditwürdigkeit von natürlichen Personen sind direkt in Anhang III aufgeführt.
DPIA (Datenschutz-Folgenabschätzung) ist bei der Implementierung automatisierter Profilierung für Kreditzwecke erforderlich, bevor etwas in Produktion geht. Das Daten-Governance-Muster, das wir für solche Systeme anwenden, beschreibt detailliert Daten-Governance für KI.
Kundenservice und Bankassistent
#Der vierte Bereich ist die Bearbeitung von Kundenanfragen: Status des Antrags, erforderliche Dokumente, Produktbedingungen, Beschwerdeverfahren. Ein Assistent, der auf dem Wissen aus Regularien, Gebührentabellen und FAQ basiert, entlastet die Berater von sich wiederholenden Anfragen.
Grundsätze, die wir in diesem Zusammenhang nicht umgehen: Der Assistent muss in den tatsächlichen Dokumenten der Institution verankert sein, da ein Modell ohne diese Verankerung Bedingungen erfinden kann, die es nicht gibt. Sobald eine Frage individuelle finanzielle Entscheidungen, Beschwerden mit rechtlicher Verantwortung oder Kontosperrungen betrifft, leitet der Assistent den Fall an einen Menschen weiter. Menschliche Aufsicht ist hier sowohl eine regulatorische Anforderung als auch eine Frage des Kundenvertrauens in die Institution.
Die Architektur dieses Assistenten basiert auf denselben Prinzipien wie die in KI für Versicherungen beschriebenen Systeme: Wissensextraktion aus Dokumenten, Guardrails gegen Improvisation, Human-Handoff bei sensiblen Angelegenheiten.
AI Act, DSGVO und wo die Grenzen liegen
#Bankwesen und Fintech sind Sektoren, in denen die Regulierung präzise festlegt, welche KI-Anwendungen als Hochrisiko gelten. Systeme zur Bewertung der Kreditwürdigkeit und Bonität von natürlichen Personen sind direkt in Anhang III des AI Act (Punkt 5b) aufgeführt. AML-Systeme, die den Zugang zu Finanzdienstleistungen beeinflussen, können derselben Klassifizierung unterliegen. Die Einstufung sollte für den konkreten Anwendungsfall mit einem Juristen bestätigt werden, bevor etwas in Produktion geht.
Praktische Implikationen der Einstufung als Hochrisiko:
- Technische Dokumentation umfasst die Beschreibung des Modells, Quellen der Trainingsdaten, Qualitätsmetriken, bekannte Einschränkungen und Retraining-Verfahren. Sie muss bei jeder wesentlichen Änderung des Modells aktualisiert werden.
- Erklärbarkeit von Entscheidungen. Jede Entscheidung mit negativen Auswirkungen auf den Kunden muss erklärbar sein: welche Signale ausschlaggebend waren, wie der Kunde Widerspruch einlegen kann.
- Human-Gate als technische Anforderung, nicht nur prozedural. Das System muss menschliches Eingreifen ermöglichen, nicht nur in Dokumenten deklarieren.
- Monitoring nach der Implementierung. Der AI Act verlangt die aktive Überwachung der Systemqualität mit Produktionsdaten und dokumentierte Verfahren bei erkannter Degradation.
DSGVO und der Schutz personenbezogener Daten (PII) sind eine separate Schicht von Anforderungen: Transaktionsdaten und Identitätsdokumente sind personenbezogene Daten, die eine rechtliche Grundlage für die Verarbeitung, Minimierung, TTL-Retention und einen Auftragsverarbeitungsvertrag bei externen Modellen erfordern. Die Pflichten aus AI Act und DSGVO für Unternehmen, die KI-Systeme einführen, beschreibt der Artikel AI Act und DSGVO 2026.
Wie man vernünftig beginnt
#Der Einstiegspunkt, den wir für den regulierten Finanzsektor als am besten kalibriert sehen: ein eng begrenztes Problem mit messbaren Kosten und geringem regulatorischem Risiko. Typischerweise ist das die Extraktion von Daten aus einer Art von KYC-Dokumenten oder die Weiterleitung von Kundenanfragen an die richtige Bearbeitungswarteschlange. Wir beginnen nicht mit Credit Risk oder AML als erstem Projekt.
Anschließend ein Pilotprojekt neben dem bestehenden Prozess im Shadow-Modus: KI bereitet vor und klassifiziert, der Mensch entscheidet weiterhin, und wir messen die tatsächliche Genauigkeit an einer Stichprobe realer Dokumente, bevor etwas eigenständig funktioniert. Erst wenn die Zahlen bekannt und akzeptiert sind, erfolgt eine schrittweise Erweiterung, wobei das Human-Gate überall beibehalten wird, wo es um Entscheidungen über Geld oder den Zugang zu Kundenservices geht.
FAQ
#Kann KI eigenständig Kreditentscheidungen ohne menschlichen Eingriff treffen?
#Wir raten davon ab, und in vielen Fällen erlaubt es das Gesetz nicht. Art. 22 DSGVO gibt natürlichen Personen das Recht, dass Entscheidungen mit rechtlichen Auswirkungen auf sie nicht ausschließlich automatisiert getroffen werden. Systeme zur Bewertung der Kreditwürdigkeit sind gemäß AI Act Hochrisikosysteme mit der Pflicht zu menschlicher Aufsicht und Erklärbarkeit. KI berechnet den Scoring und bereitet eine Begründung vor, der Analyst trifft die endgültige Entscheidung.
Wie genau ist KI bei der Extraktion von Daten aus KYC-Dokumenten?
#Das hängt von der Qualität und Standardisierung der Dokumente ab. Bei sauberen, polnischen Identitätsdokumenten erreicht eine gut abgestimmte Datenextraktions-Pipeline in der Regel eine Genauigkeit von über 90 % auf Feldebene. Bei Handyfotos, ausländischen Dokumenten oder älteren Layouts sinkt die Genauigkeit, daher bestätigt ein Mensch immer die Felder, die den weiteren Prozess beeinflussen, und das System zeigt den Quellausschnitt des Dokuments an.
Wie hoch ist die False-Positive-Rate in AML-Systemen?
#ML-basierte AML-Systeme erreichen in der Regel eine Precision von 20-40 %, was bedeutet, dass 60-80 % der Alerts False Positives sind, die manuell von einem Analysten überprüft werden müssen. Das ist immer noch besser als rein regelbasierte Systeme, erfordert aber eine angemessene Analystenbesetzung und Priorisierung der Alerts. Die Schwellenwerte des Klassifikators werden so gewählt, dass die gesamten operativen Kosten minimiert werden, nicht die Sensitivität maximiert.
Unterliegt ein AML- oder Credit-Risk-System dem AI Act?
#Systeme zur Bewertung der Kreditwürdigkeit von natürlichen Personen sind direkt in Anhang III des AI Act als Hochrisikosysteme aufgeführt. AML-Systeme, die den Zugang zu Finanzdienstleistungen beeinflussen, können derselben Klassifizierung unterliegen. Die Pflichten umfassen technische Dokumentation, DPIA, Erklärbarkeit von Entscheidungen, aktives Monitoring und die Möglichkeit, Entscheidungen durch einen Menschen anzufechten.
Können Bank- und KYC-Daten in der Unternehmensinfrastruktur verbleiben und nicht an externe Modelle weitergegeben werden?
#Ja, das ist eine Designentscheidung, keine technische Notwendigkeit. Identitäts- und Transaktionsdaten können von lokal gehosteten Modellen (Self-Hosting) oder bei einem Anbieter mit Garantie für die Verarbeitung in der EU und einem Auftragsverarbeitungsvertrag gemäß DSGVO Art. 28 verarbeitet werden. Im regulierten Finanzsektor sollte diese Entscheidung zu Beginn des Projekts bewusst getroffen werden, da sie die gesamte Architektur und den Umfang der DPIA bestimmt.
