W 2023 roku AlphaMissense scharakteryzował patogenność 71 milionów wariantów genetycznych w ciągu kilku dni. Rok później analogiczne systemy zaczęły sugerować protokoły eksperymentalne w chemii leków i wskazywać powiązania między danymi biofizycznymi a odpowiedzią na terapię. My w Cashcrown przyglądamy się tym zmianom od strony praktycznej: co z tego można dziś wdrożyć w organizacji badawczej lub firmie stosującej metody naukowe, a co pozostaje w sferze laboratoryjnych demonstracji.
Odpowiedź nie jest ani entuzjastyczna, ani pesymistyczna. AI jest dziś użytecznym asystentem na styku dyscyplin, nie autonomicznym badaczem. Różnica ma znaczenie, bo wpływa na to, gdzie stawia się punkty kontroli.
Co łączy medycynę, biologię i fizykę w kontekście AI
#Każda z trzech dziedzin gromadzi dane w innym formacie i na innej skali. Medycyna produkuje obrazy diagnostyczne, dane kliniczne i opisy przypadków. Biologia obliczeniowa operuje sekwencjami genomicznymi, strukturami białek i wynikami pomiarów kinetycznych. Fizyka dostarcza modele mechaniczne, dane sensoryczne i symulacje dynamiki molekularnej.
Przez dekady te zbiory były od siebie odizolowane, bo brak było narzędzi, które potrafiłyby jednocześnie przetwarzać tak różnorodne reprezentacje. LLM i modele wielomodalne zmieniły ten stan, choć nie bezwarunkowo.
Konkretne zadania, w których integracja danych działa powtarzalnie:
- Korelacja wyników obrazowania MRI z profilami genetycznymi pacjentów w poszukiwaniu markerów prognostycznych.
- Przeszukiwanie literatury obejmującej równocześnie publikacje z kardiologii, biofizyki błon i fizyki płynów pod kątem wspólnych mechanizmów.
- Przenoszenie modeli symulacyjnych z fizyki materiałów do modelowania twardości kości i dynamiki przerzutów.
- Ekstrakcja danych kinetycznych z opisów eksperymentów w niestandardowych formatach PDF do ujednoliconych tabel.
Każde z tych zadań skraca czas pracy badacza z tygodni do godzin lub dni. Żadne z nich nie eliminuje eksperymentu weryfikacyjnego.
Symulacje na styku fizyki i biologii: co AI wnosi i czego nie zastępuje
#Symulacje molekularne oparte na klasycznej dynamice molekularnej są obliczeniowo kosztowne: modelowanie jednej mikrosekundy zachowania białka w środowisku wodnym potrafi zająć tygodnie na klastrze obliczeniowym. Modele RAG z korpusem artykułów strukturalnych i sieci neuronowe nauczone na wynikach symulacji pozwalają tworzyć „surogatowe modele”, które przybliżają wyniki kilkadziesiąt razy szybciej.
To realna zmiana tempa pracy. Ale surrogaty mają znany tryb awarii: interpolują sprawnie w obszarze danych treningowych, zawodzą przy układach poza rozkładem. Badacz, który uruchamia symulację surogatu dla nowej klasy związku, musi wiedzieć, jak daleko od danych treningowych się porusza.
Poniższa tabela zestawia typy zadań, podejście AI i punkt, w którym wchodzi człowiek:
| Zadanie | Podejście AI | Punkt kontroli człowieka |
|---|---|---|
| Przeszukiwanie literatury | Semantyczne wyszukiwanie wielodomenowe | Ocena trafności i jakości źródeł |
| Predykcja struktury białka | Modele predykcji struktury (klasa AlphaFold) | Walidacja eksperymentalna (krystalo, cryo-EM) |
| Surogatowy model MD | Sieć nauczona na trajektoriach | Porównanie z klasyczną symulacją na próbce |
| Integracja danych klinicznych i genomicznych | Pipeline ekstrakcji + korelacja | Kliniczne znaczenie i kauzalność |
| Generowanie hipotez | LLM + baza wiedzy dziedzinowej | Selekcja i priorytetyzacja hipotez do eksperymentu |
Medycyna spersonalizowana: gdzie AI faktycznie pomaga dziś
#Medycyna spersonalizowana jest dziedziną, w której dane z różnych poziomów biologii (genomika, transkryptomika, dane kliniczne, obrazowanie) muszą być łączone do podjęcia decyzji terapeutycznych. To naturalne środowisko dla systemów integrujących heterogeniczne źródła.
Zadania, w których explainability ma dziś kluczowe znaczenie:
Stratyfikacja pacjentów. Model grupuje pacjentów na podstawie profili molekularnych, wcześniejszych odpowiedzi i danych obrazowych. Wynik to propozycja segmentacji, nie diagnoza. Klinicysta decyduje, czy granica podziału ma sens biologicznie i czy odpowiada różnicom w przebiegu klinicznym.
Wirtualny screening kandydatów terapeutycznych. AI sugeruje zbiór związków o szacowanej aktywności wobec celu terapeutycznego. Wąska selekcja z listy kandydatów trafia do laboratorium mokrego. Bez eksperymentu in vitro, a następnie in vivo, żaden z nich nie wchodzi do dalszego rozwoju.
Predykcja interakcji lek–cel w nowych populacjach. Modele wytrenowane głównie na danych europejskich populacji mogą niedoszacowywać ryzyka u pacjentów innych grup genetycznych. To znany problem stronniczości danych treningowych, który omawia artykuł o problemie czarnej skrzynki.
Zgodnie z AI Act, systemy AI przeznaczone do zastosowań medycznych są klasyfikowane jako systemy wysokiego ryzyka, gdy podlegają sektorowemu prawu produktowemu (Załącznik I AI Act, w tym MDR i IVDR). Wymagają dokumentacji technicznej, oceny zgodności i mechanizmu nadzoru po wdrożeniu.
Halucynacje i błędy w kontekście badań naukowych
#Halucynacja w systemach badawczych ma inny charakter niż w asystencie konwersacyjnym. Model może wygenerować cytowanie artykułu, który nie istnieje, podać wartość stałej kinetycznej z dokładnością do czterech miejsc po przecinku (z których żadne nie jest oparte na danych) albo zaproponować protokół eksperymentalny z krokiem odwołującym się do odczynnika niedostępnego w Polsce.
Trzy warstwy mitygacji stosowane przy wdrożeniach systemów badawczych:
- Weryfikacja każdego cytowania przez autora przed włączeniem do manuskryptu. Sprawdzone narzędzia: Semantic Scholar API, PubMed, DOI lookup.
- Structured output z JSON Schema wymuszający zakres wartości numerycznych (parametry kinetyczne, stężenia, temperatury) i flagowanie wartości spoza zakresu fizycznie sensownego.
- Log promptów i odpowiedzi jako część dokumentacji badawczej, analogicznie do logu laboratoryjnego.
Artykuł o ograniczaniu halucynacji w systemach AI szczegółowo omawia mechanizmy techniczne. W kontekście badań naukowych szczególnie przydatna jest warstwa cytowania źródeł z podaniem fragmentu tekstu, na podstawie którego model sformułował odpowiedź.
Human-oversight w badaniach interdyscyplinarnych: konkretna architektura
#Pojęcie „człowieka w pętli” bywa traktowane abstrakcyjnie. W praktycznych wdrożeniach systemów analitycznych stosuje się konkretną architekturę punktów kontroli, którą opisujemy szczegółowo w artykule o roli człowieka w pętli.
Trzy rodzaje punktów kontrolnych w projekcie badawczym z AI:
Weryfikacja przed eksperymentem. AI wygenerowało hipotezę lub protokół. Kierownik badań zatwierdza przed uruchomieniem eksperymentu fizycznego. To odpowiednik human-gate przy akcjach nieodwracalnych: odczynnik nie trafia do probówki bez podpisu PI.
Przegląd danych pośrednich. AI syntetyzuje wyniki po każdej rundzie eksperymentalnej i proponuje kolejny krok. Badacz decyduje, czy ścieżka jest biologicznie wiarygodna, czy model nie zbłądził w przestrzeni poza danymi treningowymi.
Walidacja przed publikacją. Każde twierdzenie w manuskrypcie, które pochodzi z systemu AI, jest weryfikowane przez co najmniej jednego eksperta dziedzinowego przed wysłaniem do recenzji. Wytyczne ICMJE, Nature i Science (stan na 2026 rok) jednoznacznie wykluczają AI jako autora.
Systemy, które wbudowują te punkty kontroli od początku, działają szybciej niż tradycyjny tryb pracy. Systemy bez kontroli działają szybciej tylko do momentu, gdy wynik trzeba cofnąć.
FAQ
#Czy AI może samodzielnie prowadzić badania interdyscyplinarne bez udziału naukowca?
#Nie w sensie, który byłby wiarygodny naukowo. Modele nie posiadają modelu przyczynowego świata i nie odróżniają korelacji od mechanizmu. Mogą automatyzować etapy pracy (przeszukiwanie literatury, ekstrakcja danych, generowanie hipotez, wstępna selekcja kandydatów), ale każdy z tych etapów wymaga oceny eksperta dziedzinowego. Artykuł o AI jako autonomicznym naukowcu analizuje granice tej autonomii w szczegółach.
Jakie dane są potrzebne, żeby AI skutecznie łączyło wiedzę z medycyny, biologii i fizyki?
#Dane muszą być ustrukturyzowane lub możliwe do ekstrakcji: sekwencje w formatach FASTA lub UniProt, wyniki pomiarów w tabelach z jednostkami, obrazy w standardowych formatach DICOM lub NIfTI z adnotacjami, opisy eksperymentów z numerycznymi punktami końcowymi. Im mniej ustrukturyzowane źródło, tym większe ryzyko błędu ekstrakcji. Audyt jakości danych przed wdrożeniem systemu skraca czas debugowania wyników o kilka tygodni.
Jak AI Act reguluje systemy AI stosowane w badaniach biomedycznych?
#Systemy wpływające bezpośrednio na decyzje medyczne lub dotyczące bezpieczeństwa ludzkiego są klasyfikowane jako wysokiego ryzyka na podstawie AI Act i sektorowego prawa produktowego (w tym MDR i IVDR). Wymagają dokumentacji technicznej, oceny zgodności i mechanizmu nadzoru po wdrożeniu. Systemy wspomagające wyłącznie etap przeszukiwania literatury lub generowania hipotez, które nie wpływają bezpośrednio na decyzje wysokiego ryzyka, mają łagodniejsze wymogi. Granica między tymi kategoriami jest oceniana kontekstowo przez dostawcę i kwalifikatora w ramach oceny zgodności.
Jak weryfikować hipotezy wygenerowane przez AI w badaniach naukowych?
#Weryfikacja przebiega w trzech krokach. Najpierw badacz ocenia biologiczną lub fizyczną wiarygodność hipotezy na podstawie wiedzy eksperckiej. Następnie projektuje minimalny eksperyment zdolny do obalenia hipotezy (falsyfikowalność). Na końcu wyniki eksperymentu są porównywane z predykcją modelu, a rozbieżność jest dokumentowana i analizowana niezależnie od kierunku. Artykuł o LLM jako generatorze hipotez omawia dokładnie ten cykl.
Czy AI pomaga przy interdyscyplinarnych przeglądach literatury i co grozi jego niekrytycznemu użyciu?
#Tak, wyszukiwanie semantyczne na dużym korpusie jest jednym z najmocniejszych zastosowań AI w nauce. Ryzyko niekrytycznego użycia to trzy rzeczy: model może podać nieistniejące cytowania (halucynacja), może systematycznie pomijać źródła historycznie niedoreprezentowane w danych treningowych, i może nadawać nadmierne znaczenie wysoko cytowanym pracom kosztem nowych wyników. Weryfikacja każdego cytowania przed włączeniem do manuskryptu i ręczne uzupełnienie listy źródeł z baz pierwotnych (PubMed, Scopus, Web of Science) są obowiązkowe.
