Dział KYC w firmie fintech obsługuje pięć tysięcy onboardingów miesięcznie. Każdy klient przysyła dowód osobisty, potwierdzenie adresu i wyciąg bankowy w różnych formatach, z różną jakością skanu, czasem zdjęcie z telefonu pod niekorzystnym kątem. Ktoś to wszystko otwiera, sprawdza, przepisuje dane do systemu CRM i decyduje, czy dokument jest wystarczająco czytelny, żeby kontynuować. Przy pięciu tysiącach spraw miesięcznie to kilkadziesiąt roboczogodzin samego przepisywania. I właśnie tu AI ma mierzalny sens. Problem zaczyna się, gdy ktoś obiecuje „w pełni automatyczny KYC bez człowieka” albo „AML, który sam blokuje konta”. To inna rozmowa, dotykająca prawa konsumenta, RODO i AI Act. Poniżej rozdzielamy jedno od drugiego, bez obietnic, których w regulowanym sektorze dotrzymać się nie da.
KYC i onboarding: ekstrakcja dokumentów bez stosu ręcznej pracy
#Pierwszy obszar, który daje realny zwrot, to zamiana dokumentów tożsamości, zaświadczeń adresowych i wyciągów bankowych w ustrukturyzowane rekordy. OCR odczytuje tekst z obrazu, a model językowy wyciąga konkretne pola: imię i nazwisko, numer dokumentu, datę urodzenia, adres, numer IBAN.
Na czystych, standardowych dokumentach (dowód osobisty z nowoczesnym układem, wydruk bankowy) dobrze zestrojony pipeline ekstrakcji danych osiąga trafność powyżej 90% na poziomie pól. Na zdjęciach z telefonu, starszych dokumentach z niejednolitym layoutem albo dokumentach zagranicznych trafność spada i bywa trudna do przewidzenia bez testów na reprezentatywnej próbce rzeczywistych dokumentów. Dlatego nie zakłada się, że odczytana data urodzenia jest zawsze prawidłowa: przy polach wpływających na dalszy proces człowiek potwierdza, a system pokazuje fragment dokumentu, z którego wartość pochodzi.
| Typ dokumentu | Co wyciąga AI | Spodziewana trafność pól | Rola człowieka |
|---|---|---|---|
| Dowód osobisty / paszport PL | Imię, nazwisko, PESEL, data ważności | Wysoka (zwykle powyżej 90%) | Akceptuje dane do onboardingu |
| Zaświadczenie adresowe / rachunek | Adres, data dokumentu | Wysoka na typowych drukach | Weryfikuje adres vs deklarowany |
| Wyciąg bankowy | IBAN, saldo, historia obrotów | Średnia, zależna od banku i formatu | Potwierdza zgodność z wnioskiem |
| Dokument zagraniczny / odręczny | Próba odczytu kluczowych pól | Niska i zmienna | Weryfikuje ręcznie sporne pola |
Jak zadbać o jakość i strukturę danych źródłowych, żeby pipeline miał z czego korzystać, opisujemy w governance danych do AI. Ekstrakcję danych z dokumentów w innych kontekstach omawia AI do analizy dokumentów.
AML: monitoring transakcji i flagowanie anomalii
#Przeciwdziałanie praniu pieniędzy to obszar, w którym AI robi realną różnicę w stosunku do systemów czysto regułowych. Wzorzec regułowy wymaga, żeby ktoś z góry wiedział, jakiego progu szukać. Model anomalii uczy się rozkładu normalności i sygnalizuje odchylenie, zanim ktokolwiek zdąży ustawić regułę.
Architektura, którą stosujemy, działa w warstwach. Warstwa regułowa wyłapuje proste przekroczenia (kwota powyżej limitu, kraj poza białą listą). Warstwa statystyczna wykrywa rozsypanie wielu małych transakcji celowo zaprojektowanych poniżej progu. Warstwa modelowa, oparta na klasyfikatorze trenowanym na historii transakcji, ocenia prawdopodobieństwo podejrzanej aktywności i produkuje sygnał ryzyka z wyjaśnieniem, które cechy zadecydowały. Szczegółową architekturę wielowarstwową, razem z kwestią zimnego startu, opisuje AI do wykrywania oszustw i anomalii.
Tu trzeba powiedzieć głośno to, co w wielu prezentacjach się przemilcza: wskaźnik fałszywych alarmów (false positive rate) w AML to realne koszty operacyjne. Analitycy compliance spędzają czas na sprawdzaniu alertów, które okazują się czystymi transakcjami. Typowe systemy AML ML osiągają precision na poziomie 20-40%, co oznacza, że 60-80% alertów to fałszywe alarmy wymagające ręcznego odrzucenia. To dalej lepsza sytuacja niż systemy czysto regułowe, które generują jeszcze więcej fałszywych alarmów, ale nie należy tego przemilczać przy projektowaniu obsady analityków.
Granica nienaruszalna: zgłoszenie do organu finansowego (raport STR/SAR), zamknięcie konta i odmowa transakcji to działania nieodwracalne, które wymagają decyzji człowieka z pełnym uzasadnieniem w logu audytowym.
Credit risk: scoring jako wsparcie, nie wyrok
#Ocena zdolności kredytowej to prawdopodobnie najbardziej regulowany obszar zastosowań AI w finansach. AI może tu obliczyć scoring, zestawić sygnały ryzyka i przygotować uzasadnienie dla analityka. Nie może samodzielnie odmówić kredytu osobie fizycznej bez możliwości interwencji człowieka.
Powód jest zarówno prawny, jak i praktyczny. Prawny: automatyczne decyzje wywołujące skutki prawne wobec osoby fizycznej wymagają prawa do interwencji człowieka, zgodnie z art. 22 RODO. Praktyczny: model trenowany na danych historycznych może utrwalać wzorce dyskryminacyjne, jeśli historyczne decyzje były stronnicze (np. wyższy odsetek odmów dla konkretnych grup demograficznych lub regionów).
Wyjaśnialność decyzji to wymóg, nie opcja wygody. Analityk zatwierdzający lub odrzucający wniosek musi rozumieć, które sygnały pchnęły scoring w górę lub w dół: SHAP values dla modeli gradient boosting pozwalają pokazać wkład każdej cechy do oceny. To jest też wymóg AI Act dla systemów wysokiego ryzyka, a systemy oceny zdolności kredytowej osób fizycznych są wprost wymienione w Załączniku III.
DPIA (ocena skutków dla ochrony danych) jest wymagana przy wdrożeniu zautomatyzowanego profilowania w celach kredytowych, zanim cokolwiek trafi do produkcji. Wzorzec governance danych, który stosujemy do takich systemów, opisuje szczegółowo governance danych do AI.
Obsługa klienta i asystent bankowy
#Czwarty obszar to obsługa pytań klientów: status wniosku, wymagane dokumenty, warunki produktu, procedury reklamacyjne. Asystent oparty na wiedzy z regulaminów, taryf opłat i FAQ odciąża konsultantów od powtarzalnych zapytań.
Zasady, których nie omijamy w tym kontekście: asystent musi być ugruntowany w rzeczywistych dokumentach instytucji, bo model bez tej kotwicy potrafi zmyślić warunek umowy, którego nie ma. W momencie, gdy pytanie dotyczy indywidualnej decyzji finansowej, reklamacji z elementem odpowiedzialności prawnej albo blokady konta, asystent przekazuje sprawę człowiekowi. Nadzór człowieka to tu zarówno wymóg regulacyjny, jak i kwestia zaufania klienta do instytucji.
Architektura tego asystenta opiera się na tych samych zasadach co systemy opisane w AI dla ubezpieczeń: ekstrakcja wiedzy z dokumentów, guardrails blokujące improwizację, human-handoff przy sprawach wrażliwych.
AI Act, RODO i gdzie leżą granice
#Bankowość i fintech to sektory, w których regulacje precyzyjnie wskazują, które zastosowania AI są wysokiego ryzyka. Systemy oceny wiarygodności kredytowej i zdolności kredytowej osób fizycznych są wymienione wprost w Załączniku III AI Act (pkt 5b). Systemy AML, jeśli wpływają na dostęp do usług finansowych, mogą podlegać tej samej klasyfikacji. Klasyfikację warto potwierdzić dla konkretnego zastosowania z prawnikiem, zanim cokolwiek trafi do produkcji.
Praktyczne implikacje klasyfikacji jako wysokie ryzyko:
- Dokumentacja techniczna obejmuje opis modelu, źródła danych treningowych, metryki jakości, znane ograniczenia i procedury retreningu. Musi być aktualizowana przy każdej istotnej zmianie modelu.
- Wyjaśnialność decyzji. Każda decyzja z negatywnym skutkiem dla klienta musi być wyjaśnialna: które sygnały zadecydowały, jak klient może się odwołać.
- Human-gate jako wymóg techniczny, nie tylko proceduralny. System musi umożliwiać interwencję człowieka, nie tylko deklarować ją w dokumentach.
- Monitorowanie po wdrożeniu. AI Act wymaga aktywnego śledzenia jakości systemu na danych produkcyjnych i udokumentowanych procedur przy wykrytej degradacji.
RODO i ochrona danych osobowych (PII) to osobna warstwa wymagań: dane transakcyjne i dokumenty tożsamości to dane osobowe wymagające podstawy prawnej przetwarzania, minimalizacji, retencji TTL i umowy powierzenia przy zewnętrznych modelach. Obowiązki wynikające z AI Act i RODO dla firm, które wdrażają systemy AI, opisuje artykuł AI Act i RODO 2026.
Jak zacząć rozsądnie
#Punkt wejścia, który widzimy jako najlepiej skalibrowany dla regulowanego sektora finansowego: jeden wąski problem z policzalnym kosztem i niskim ryzykiem regulacyjnym. Typowo to ekstrakcja danych z jednego rodzaju dokumentu KYC albo routing zapytań klientów do właściwej kolejki obsługi. Nie zaczynamy od credit risk ani od AML jako pierwszego projektu.
Potem pilotaż obok obecnego procesu w trybie shadow: AI przygotowuje i typuje, człowiek nadal decyduje, a my mierzymy realną trafność na próbce rzeczywistych dokumentów, zanim cokolwiek zacznie działać samodzielnie. Dopiero gdy liczby są znane i zaakceptowane, stopniowe rozszerzanie, z zachowanym human-gate wszędzie tam, gdzie w grę wchodzi decyzja o pieniądzach lub dostępie do usługi klienta.
FAQ
#Czy AI może samodzielnie podejmować decyzje kredytowe bez udziału człowieka?
#Nie zalecamy tego i w wielu przypadkach prawo na to nie pozwala. Art. 22 RODO przyznaje osobie fizycznej prawo do tego, żeby decyzja wywołująca wobec niej skutki prawne nie była podejmowana wyłącznie automatycznie. Systemy oceny zdolności kredytowej to systemy wysokiego ryzyka wg AI Act, z obowiązkiem nadzoru człowieka i wyjaśnialności. AI oblicza scoring i przygotowuje uzasadnienie, analityk podejmuje ostateczną decyzję.
Jak dokładny jest AI do ekstrakcji danych z dokumentów KYC?
#To zależy od jakości i standaryzacji dokumentów. Na czystych, polskich dokumentach tożsamości dobrze zestrojony pipeline ekstrakcji danych osiąga zwykle trafność powyżej 90% na poziomie pól. Na zdjęciach z telefonu, dokumentach zagranicznych czy starszych układach trafność spada, dlatego pola wpływające na dalszy proces zawsze potwierdza człowiek, a system pokazuje źródłowy fragment dokumentu.
Jak wysoki jest wskaźnik fałszywych alarmów w systemach AML?
#Systemy AML oparte na ML osiągają precision zwykle w zakresie 20-40%, co oznacza, że 60-80% alertów to fałszywe alarmy wymagające ręcznego sprawdzenia przez analityka. To wciąż lepsza sytuacja niż systemy czysto regułowe, ale wymaga odpowiedniej obsady analityków i priorytetyzacji alertów. Progi klasyfikatora dobiera się pod minimalizację łącznego kosztu operacyjnego, nie pod maksymalizację czułości.
Czy system AML lub credit risk podlega AI Act?
#Systemy oceny zdolności kredytowej osób fizycznych są wprost wymienione w Załączniku III AI Act jako systemy wysokiego ryzyka. Systemy AML wpływające na dostęp do usług finansowych mogą podlegać tej samej klasyfikacji. Obowiązki to dokumentacja techniczna, DPIA, wyjaśnialność decyzji, aktywne monitorowanie i możliwość zakwestionowania decyzji przez człowieka.
Czy dane bankowe i KYC mogą zostać w infrastrukturze firmy i nie trafić do zewnętrznego modelu?
#Tak, to decyzja projektowa, nie konieczność techniczna. Dane tożsamości i transakcyjne mogą być przetwarzane przez modele uruchamiane lokalnie (self-hosting) albo u dostawcy z gwarancją przetwarzania w EU i umową powierzenia zgodną z RODO art. 28. W regulowanym sektorze finansowym warto podjąć tę decyzję świadomie na samym początku projektu, bo determinuje całą architekturę i zakres DPIA.