AI a teoria umysłu: czy maszyna zrozumie intencje naukowca?

Kiedy badacz wpisuje w asystenta AI pytanie o mechanizm działania enzymu, model odpowiada na podstawie statystycznych wzorców w miliardach tokenów tekstu naukowego. Ale czy rozumie, że pytanie pochodzi z frustracji po nieudanym eksperymencie? Że szuka nie tylko definicji, lecz punktu zaczepienia do nowej hipotezy? To rozróżnienie ma praktyczne konsekwencje dla każdego, kto projektuje systemy AI wspomagające pracę badawczą.

Czym jest teoria umysłu i dlaczego AI jej nie ma

Teoria umysłu (ang. Theory of Mind, ToM) to zdolność przypisywania innym ludziom stanów mentalnych: przekonań, intencji, pragnień, wiedzy. Dziecko nabywa ją między trzecim a piątym rokiem życia. Dzięki niej wiemy, że kolega mówi nieprawdę nie dlatego, że kłamie, lecz dlatego, że czegoś nie wie.

Modele językowe nie mają tej zdolności w sensie mechanistycznym. Ich architektura opiera się na przewidywaniu kolejnego tokenu na podstawie kontekstu, a nie na reprezentacji stanów wewnętrznych rozmówcy. Badania z 2023 i 2024 roku pokazują, że LLM mogą przechodzić niektóre klasyczne testy ToM, takie jak zadanie fałszywego przekonania, ale robią to dzięki wzorcom w danych treningowych, nie dzięki rzeczywistemu modelowaniu umysłu rozmówcy. Gdy test jest nawet nieznacznie przeformułowany, wynik wyraźnie spada.

Dla pracy badawczej to różnica między narzędziem, które odpowiada na pytanie dosłownie, a asystentem, który rozumie kontekst za pytaniem.

Co AI faktycznie odczytuje z pytania badacza

Nawet bez teorii umysłu model ma realną użyteczność przy interpretacji intencji. Warto oddzielić, co działa od tego, co nie działa.

Co działa powtarzalnie. Model wyciąga intencję z sygnałów leksykalnych i strukturalnych: słów kluczowych, trybu gramatycznego, długości pytania, obecności poprzednich wymian w oknie kontekstowym. Jeśli badacz pisze „jakie mechanizmy wyjaśniają X”, model rozpoznaje pytanie wyjaśniające i odpowiada inaczej niż na „jak zmierzyć X”. Dla dobrze opisanych intencji (recenzja literatury, synteza, porównanie metodologii) trafność jest wysoka.

Co nie działa. Model nie odczytuje emocji, poziomu frustracji, ukrytych założeń ani historii projektu, chyba że badacz je wprost wpisał w prompt. Nie wie, że badacz właśnie odrzucił trzecią hipotezę z rzędu i szuka czegoś innego. Nie modeluje, że pytanie pochodzi z dziedziny, w której badacz jest ekspertem, i że odpowiedź na poziomie wprowadzającym będzie bezużyteczna.

W Cashcrown przy projektowaniu asystentów RAG dla klientów z sektora R&D obserwujemy ten wzorzec regularnie: model odpowiada precyzyjnie na pytanie dosłowne, ale mija się z intencją badacza, gdy ta nie jest jawnie wyrażona w prompcie.

Konsekwencje dla projektowania systemów badawczych

Brak ToM w AI nie eliminuje jej użyteczności w nauce. Zmienia natomiast architekturę systemu, który chcemy zbudować.

Element systemu	Bez uwzględnienia braku ToM	Z uwzględnieniem braku ToM
Interfejs pytań	Jedno pole tekstowe	Ustrukturyzowany formularz: cel, kontekst, ograniczenia
Interpretacja wyników	Model interpretuje sam	Badacz weryfikuje trafność intencji przed użyciem
Iteracja	Jedna odpowiedź	Kilka wariantów interpretacji pytania do wyboru
Dokumentacja	Brak	Log promptów i intencji jako część dokumentacji badawczej

Projektując system, który ma wspomagać pracę naukową, warto wbudować mechanizm, w którym model jawnie parafrazuje rozumianą intencję przed udzieleniem odpowiedzi. To prosty wzorzec, który dramatycznie redukuje rozbieżność między tym, co badacz chciał wiedzieć, a tym, co model uznał za pytanie.

Wypróbuj na żywo

▶Model parafrazuje intencję pytania badawczegosandbox · reasoning

Halucynacje intencji: gdy model „odgaduje” za bardzo

Halucynacje w kontekście teorii umysłu mają szczególną formę. Model, zamiast odpowiedzieć „nie wiem, co masz na myśli”, czasem konstruuje odpowiedź opartą na domniemanej intencji, której w pytaniu nie było.

Przykład z praktyki: badacz pyta o „protokół izolacji RNA z próbek FFPE”. Model odpowiada na temat standardowych protokołów, nie sygnalizując, że dla próbek FFPE starszych niż trzy lata istnieje wyspecjalizowana procedura naprawy fragmentacji. Nie wiedząc, że badacz pracuje ze starymi archiwalnymi tkankami, model pominął kluczową informację nie ze złośliwości, lecz dlatego, że nie miał danych o kontekście.

Explainability w takich systemach oznacza nie tylko wyjaśnienie, skąd pochodzi odpowiedź, lecz też jawne sygnalizowanie, jakie założenia model przyjął o intencji pytającego. Bez tego badacz nie wie, czego odpowiedź nie obejmuje.

Human-oversight: gdzie człowiek musi wejść w pętlę

Brak teorii umysłu przekłada się bezpośrednio na wymagania dotyczące human-oversight w systemach badawczych. Nie jest to kwestia ostrożności na wyrost, lecz konsekwencja architektury modelu.

Trzy punkty, w których interwencja badacza jest obowiązkowa:

Pierwszy to weryfikacja trafności intencji po pierwszej odpowiedzi modelu. Badacz ocenia, czy model odpowiedział na pytanie, które zadał, czy na pytanie, które model zinterpretował. To zajmuje chwilę, ale eliminuje godziny pracy w złym kierunku.

Drugi to akceptacja hipotezy przed eksperymentem. LLM jako generator hipotez może zaproponować kilkanaście kandydatów, ale wybór do eksperymentowania wymaga oceny biologicznej, chemicznej lub dziedzinowej wiedzy eksperta. Model nie wie, które hipotezy są eksperymentalnie wykonalne przy dostępnych zasobach laboratoryjnych.

Trzeci to walidacja przed włączeniem do manuskryptu. Każde twierdzenie wygenerowane przez AI, które trafi do publikacji, musi być zweryfikowane przez badacza z podaniem źródła pierwotnego, nie wyjścia modelu.

Wzorzec human-gate stosowany przy agentach w Cashcrown działa dokładnie na tej zasadzie: każda akcja nieodwracalna wymaga jawnego potwierdzenia. W badaniach odpowiednikiem jest zatwierdzenie protokołu przed uruchomieniem eksperymentu.

Co zmienia się, gdy AI lepiej interpretuje kontekst

Kierunek rozwoju modeli w 2025 i 2026 roku to wydłużone okna kontekstowe, lepsza obsługa wieloetapowych instrukcji i eksplicytna parametryzacja roli użytkownika w prompcie systemowym. To realnie zbliża modele do użyteczniejszej interpretacji intencji, nawet bez teorii umysłu w sensie kognitywnym.

Praktyczne implikacje dla systemów badawczych:

Prompt systemowy z opisem roli badacza (dziedzina, poziom ekspertyzy, kontekst projektu) poprawia trafność odpowiedzi znacznie bardziej niż zmiana modelu.
Wieloetapowy dialog, w którym model w pierwszym kroku parafrazuje intencję i czeka na korektę, działa lepiej niż jednoetapowe zapytanie.
Integracja z systemem zarządzania wiedzą projektu (notatki, poprzednie eksperymenty, odrzucone hipotezy) przez wyszukiwanie semantyczne (RAG) częściowo kompensuje brak pamięci kontekstowej modelu o historii projektu.

Każde z tych rozwiązań redukuje lukę intencyjną bez wymagania, by model „rozumiał” naukowca w ludzkim sensie. To realistyczna trajektoria na 2026 i 2027 rok, w odróżnieniu od spekulacji o maszynach posiadających prawdziwą teorię umysłu.

FAQ

Czy LLM przejdą kiedyś klasyczne testy teorii umysłu?

Niektóre modele już teraz osiągają wysokie wyniki na standardowych testach ToM, takich jak zadanie fałszywego przekonania. Jednak badania pokazują, że jest to efekt zapamiętywania wzorców z danych treningowych, nie prawdziwego modelowania stanów mentalnych. Drobna modyfikacja testu potrafi spowodować wyraźny spadek trafności. Interpretacja „zdania testu” jako dowodu na posiadanie ToM jest metodologicznie błędna.

Jak projektować prompt, by model lepiej odczytywał intencję pytania?

Najbardziej skuteczne podejście to jawne opisanie kontekstu pytania: dziedzina, cel, ograniczenia, poziom oczekiwanej odpowiedzi. Zamiast „jakie mechanizmy wyjaśniają X” warto napisać „jestem biochemikiem pracującym nad inhibitorami kinazy, szukam mechanizmów wyjaśniających zmienność w pomiarach proliferacji, na poziomie artykułu przeglądowego”. Model odpowiada na pytanie dosłowne, więc im bardziej dosłownie opisana intencja, tym trafniejsza odpowiedź.

Czy brak teorii umysłu w AI stanowi problem etyczny w badaniach?

W kontekście badań naukowych nie jest to bezpośredni problem etyczny, lecz architektoniczny. Model nie interpretuje intencji badacza, co oznacza, że badacz musi jawnie weryfikować, czy odpowiedź modelu odpowiada na pytanie, które zamierzał zadać. Etyczny wymiar pojawia się, gdy wyniki modelu trafiają do publikacji bez tej weryfikacji, co narusza standardy reprodukowalności i odpowiedzialności naukowej.

Jak system RAG pomaga kompensować brak teorii umysłu?

Wyszukiwanie semantyczne (RAG) dostarcza modelowi kontekst specyficzny dla projektu: wcześniejsze wyniki eksperymentów, odrzucone hipotezy, notatki badacza. To nie eliminuje braku ToM, ale redukuje najczęstszą przyczynę rozbieżności intencji: model nie wiedział, co badacz już próbował. Przy dobrze zaprojektowanym indeksie wiedzy projektowej model ma wystarczający kontekst, by odpowiadać na pytanie badacza, nie na pytanie ogólne.

Jak AI Act reguluje systemy AI interpretujące intencje użytkownika w badaniach?

AI Act nie definiuje osobnej kategorii dla systemów interpretujących intencje, ale systemy AI stosowane w badaniach wpływających na decyzje medyczne, regulacyjne lub dotyczące bezpieczeństwa ludzkiego podlegają wymogom systemów wysokiego ryzyka: rejestr, dokumentacja techniczna, ocena zgodności, nadzór po wdrożeniu. Systemy wspomagające przeszukiwanie literatury lub wstępną syntezę, które nie wpływają bezpośrednio na decyzje wysokiego ryzyka, mają łagodniejsze wymagania.

Zagadnienia wyjaśnialności systemów AI, roli człowieka w pętli decyzyjnej i autonomii AI w nauce są bezpośrednio powiązane z pytaniem o teorię umysłu. Jeśli projektujesz system badawczy oparty na AI, narzędzie do oceny gotowości pozwoli zidentyfikować luki architektury zanim trafisz na problem intencji w produkcji.

Powiązana realizacjadowodyIO — akta sprawy w audytowalny materiał dowodowy