AI w Wielkim Zderzaczu Hadronów: jak filtrować zderzenia

Wielki Zderzacz Hadronów w CERN generuje podczas pracy kolizje protonów z częstotliwością rzędu dziesiątek milionów na sekundę. Zapisanie surowych danych z każdego zderzenia jest fizycznie niemożliwe: przepustowość pamięci i sieci nie nadążają. Dlatego system wyzwalania (trigger) musi odrzucić zdecydowaną większość zdarzeń w czasie rzędu kilku mikrosekund, zanim dane w ogóle trafią na dysk. Przez dekady robił to sprzęt elektroniczny zaprojektowany pod konkretne sygnatury cząstek. Od kilku lat w niektórych warstwach tego pipeline'u pojawiają się modele uczenia maszynowego. Nie zastępują fizyków. Pomagają im szybciej odróżniać sygnał od szumu w danych o strukturze, której ręczne reguły nie opisują w pełni.

Dlaczego filtrowanie zdarzeń jest problemem obliczeniowym

Zderzenie protonów w LHC produkuje dziesiątki cząstek wtórnych. Każda z nich zostawia ślad w kilku warstwach detektora. Jedno zdarzenie to strumieniowy zapis z setek tysięcy kanałów pomiarowych. Przy dziesiątkach milionów zderzeń na sekundę powstaje strumień danych, który nawet przy agresywnej kompresji liczy się w terabajtach na sekundę.

Tradycyjny system wyzwalania pracuje w dwóch lub trzech warstwach. Pierwsza warstwa (Level-1 trigger) to sprzęt programowalny (FPGA), który w czasie rzędu kilku mikrosekund stosuje proste kryterium: czy energia zmierzona w danym obszarze detektora przekracza próg? Zdarzenia, które nie przejdą tego testu, są bezpowrotnie odrzucane. Druga i trzecia warstwa działają wolniej, ale mają dostęp do pełniejszej rekonstrukcji śladu cząstki i mogą stosować bardziej złożone kryteria.

Problem jest strukturalny: ręcznie zdefiniowane reguły progowe są skuteczne dla procesów, które fizycy potrafią z góry opisać matematycznie. Dla rzadkich procesów, których sygnatura jest zbliżona do tła, reguły albo przepuszczają zbyt wiele szumu, albo odrzucają potencjalnie interesujące zdarzenia. Tu wchodzą modele uczenia maszynowego.

Co robi model klasyfikacyjny w systemie trigger

W kilku eksperymentach przy LHC (m.in. LHCb i ATLAS) testowane są sieci neuronowe wdrożone bezpośrednio na układach FPGA lub w szybkiej warstwie programowej tuż za Level-1. Model dostaje na wejściu wektor cech opisujących jedno zdarzenie: energie, pędy, kąty, identyfikatory wierzchołków wtórnych. Na wyjściu produkuje wynik wskazujący, czy zdarzenie pasuje do konkretnej klasy procesów fizycznych.

Kluczowy kompromis to czas wnioskowania. Model musi zmieścić się w oknie czasowym systemu wyzwalania, często poniżej kilku mikrosekund. To wyklucza modele dużych rozmiarów. Stosowane architektury to płytkie sieci w pełni połączone lub wyspecjalizowane sieci grafowe (do rekonstrukcji śladów w przestrzeni 3D). Precyzja klasyfikacji jest mierzalna i porównywalna z alternatywami: interesuje fizyków konkretnie, ile procent zdarzeń sygnałowych model przepuszcza i ile procent tła błędnie oznacza jako sygnał.

Poniższa tabela porównuje trzy podejścia do selekcji zdarzeń w jednej klasie procesów:

Podejście	Skuteczność sygnału	Odsetek tła (przybliżony)	Czas decyzji
Ręczne reguły progowe	wysoka dla znanych sygnatur	wysoki przy nowych procesach	kilka µs
Płytka sieć neuronowa (FPGA)	porównywalna lub wyższa	niższy o kilkanaście procent	1-3 µs
Grafowa sieć neuronowa (CPU/GPU)	najwyższa w testach	najniższy w testach	10-100 µs

Liczby są przybliżone i zależą silnie od konkretnego kanału fizycznego. My w Cashcrown nie pracujemy przy detektorach cząstek, ale architektura problemu jest nam znajoma: szybki klasyfikator jako bramka wstępna, wolniejsza i droższa analiza tylko dla zdarzeń, które przeszły filtr.

Granice: czego model nie potrafi

Każdy model klasyfikacyjny w triggerze jest wytrenowany na symulacjach Monte Carlo i danych zebranych w poprzednich przebiegach (run-ach). To oznacza, że model rozpoznaje klasy procesów, których przykłady były w zbiorze treningowym. Zdarzenie z „nowej fizyki” (procesów wykraczających poza Model Standardowy) może mieć sygnaturę, której model nigdy nie widział. W takiej sytuacji klasyfikator z dużym prawdopodobieństwem odrzuci to zdarzenie jako tło, ponieważ nie pasuje do żadnego wzorca, który uznał za sygnał.

To nie jest defekt projektu. To jest fundamentalne ograniczenie uczenia nadzorowanego: model generalizuje na podstawie tego, co widział. Dlatego systemy AI w triggerze nie zastępują dotychczasowych reguł. Działają równolegle albo w dodatkowej warstwie, a część przepustowości jest celowo zostawiana dla zdarzeń wybranych losowo lub przez klasyczne reguły, które pełnią rolę siatki bezpieczeństwa.

Drugi problem to dryft detektora. Warunki pracy LHC zmieniają się: luminozja rośnie, materiał detektora się starzeje, geometria kabli wpływa na rozkłady sygnałów. Model wytrenowany na danych z początku sezonu pomiarowego może tracić skuteczność po kilku miesiącach. Observability systemu AI w triggerze wymaga ciągłego monitorowania rozkładów cech wejściowych i wskaźnika akceptacji, nie tylko wydajności obliczeniowej.

Trzecia granica to wyjaśnialność. Fizyk, który odkrył anomalię w danych, musi potrafić wyjaśnić, dlaczego zdarzenie zostało zatrzymane przez trigger. Gdy decyzję podjął klasyczny filtr progowy, wyjaśnienie jest trywialne. Gdy podjęła je sieć neuronowa, fizyk potrzebuje narzędzi do weryfikacji, czy model nie kierował się korelacją artefaktową zamiast sygnałem fizycznym.

Human-oversight: gdzie ekspert wchodzi w pętlę

Model triggerowy nie działa w próżni. Przy każdym wdrożeniu nowego modelu lub zmianie jego parametrów obowiązuje procedura walidacji przez fizyka odpowiedzialnego za dany kanał pomiarowy. Sprawdzana jest zgodność rozkładów wyjściowych modelu z symulacjami Monte Carlo, stabilność wskaźnika akceptacji w czasie i brak korelacji wyniku z artefaktami detektora.

W dużych kolaboracjach (ATLAS, CMS, LHCb) zmiany w systemie triggerowym przechodzą przez wewnętrzną procedurę recenzji. Nikt nie wdraża nowej wersji modelu między zbieraniem danych. Każda zmiana konfiguracji triggera jest precyzyjnie datowana i logowana, bo to warunkuje poprawność analizy danych zebranych przed zmianą i po niej.

Wzorzec human-oversight jest tu strukturalny: model podejmuje decyzję operacyjną (zapisać zdarzenie czy nie), ale walidacja modelu, decyzja o wdrożeniu i interpretacja wyników pozostają po stronie eksperta. To samo podejście stosujemy przy systemach AI dla klientów Cashcrown: żaden model klasyfikacyjny nie trafia na produkcję bez zatwierdzonego golden-setu i zdefiniowanych progów eskalacji do człowieka. Różnica skali jest olbrzymia, ale architektura nadzoru jest analogiczna.

Warto zaznaczyć, że human-oversight nie spowalnia automatycznie zbierania danych. Decyzje triggera zapadają w czasie rzeczywistym bez udziału człowieka. Nadzór dotyczy walidacji modeli i interpretacji zebranych danych, nie każdego zdarzenia z osobna.

▶Oceń projekt systemu trigger dla nowego kanału fizycznegosandbox · reasoning

Kierunek: anomaly detection bez etykiet

Osobnym kierunkiem badań, który zyskuje na znaczeniu, jest wykrywanie anomalii bez nadzoru (unsupervised anomaly detection) jako uzupełnienie klasycznych triggerów. Zamiast klasyfikować zdarzenia do znanych klas, model uczy się gęstości rozkładu zdarzeń tła i flaguje te, które odchylają się od normy. Taki system mógłby w zasadzie zapisywać zdarzenia z nieznaną sygnaturą, której ręczne reguły by nie wyłapały.

To podejście jest jednak znacznie trudniejsze w walidacji. Nie ma etykiet, więc nie ma bezpośredniej miary skuteczności. Fizyk musi ocenić, czy zdarzenia flagowane jako anomalie są interesujące fizycznie, czy są artefaktami detektora. Przy triggerze działającym w czasie rzeczywistym i ograniczonej przepustowości zapisu, zbyt czuły detektor anomalii zaleje pamięć masową szumem.

W naszych wdrożeniach podobny problem pojawia się w systemach detekcji oszustw i monitoringu jakości produkcji: model wykrywający anomalie jest użyteczny dopiero wtedy, gdy ma zdefiniowane progi eskalacji i jasną ścieżkę do weryfikacji przez człowieka. Bez tego produkuje alert fatigue, który ostatecznie jest wyłączany. Artykuł o problemie czarnej skrzynki omawia szczegółowo, jak budować wyjaśnialność w systemach, których decyzje są trudne do interpretacji.

FAQ

Czy AI może samodzielnie odkryć nową cząstkę w danych z LHC?

Nie w sensie autonomicznym. Model może wskazać grupę zdarzeń statystycznie odbiegającą od oczekiwanego tła, ale interpretacja tego odchylenia jako sygnału nowej fizyki wymaga analizy przez zespół fizyków: sprawdzenia efektów systematycznych, weryfikacji niezależnymi metodami i ostatecznie eksperymentu potwierdzającego. AI przyspiesza wstępną selekcję kandydatów, ale odkrycie jest zawsze wynikiem pracy ludzkiej.

Jakie modele uczenia maszynowego nadają się do wdrożenia na FPGA w triggerze?

Główne ograniczenia to czas wnioskowania i zasoby sprzętowe układu. Na FPGA praktycznie wdrażalne są płytkie sieci w pełni połączone (kilka warstw, kilkadziesiąt neuronów na warstwę) oraz proste drzewa decyzyjne skwantyzowane do arytmetyki stałoprzecinkowej. Biblioteka hls4ml pozwala syntetyzować modele z PyTorch/Keras bezpośrednio do kodu HDL. Głębokie modele grafowe działają na GPU w warstwie programowej triggera wyższego poziomu, gdzie okno czasowe jest szersze.

Jak dryft detektora wpływa na skuteczność modelu i jak sobie z nim radzić?

Dryft detektora oznacza, że rozkłady cech wejściowych modelu zmieniają się w czasie. Model wytrenowany na danych z początku sezonu traci skuteczność, gdy luminozja rośnie lub gdy geometria detektora ulega modyfikacji. Standardowe podejście to monitorowanie rozkładów cech w czasie rzeczywistym (data quality monitoring), regularne retrenowanie na najnowszych danych i utrzymywanie wersji modelu ściśle przypisanej do przedziału czasu zbierania danych.

Czy systemy AI w triggerze podlegają AI Act?

Bezpośrednie zastosowania naukowe w CERN prawdopodobnie nie podlegają AI Act w zakresie wysokiego ryzyka, bo nie wpływają bezpośrednio na decyzje dotyczące ludzi (kategorie z Załącznika III). Jednak każda organizacja, która wdraża systemy AI wspomagające decyzje regulacyjne lub wpływające na bezpieczeństwo, powinna przeprowadzić ocenę klasyfikacji ryzyka. Dla firm komercyjnych wdrażających AI w podobnych domenach (przemysł, medycyna) odpowiedź może być inna, patrz obowiązki firm w 2026.

Czym różni się problem filtrowania zdarzeń od typowego biznesowego klasyfikatora?

Główne różnice to: skala przepustowości (zdarzenia co mikrosekundy, nie sekundy), brak możliwości odwołania (odrzucone zdarzenie jest utracone na zawsze), pełna kontrola nad danymi treningowymi (symulacje) przy jednoczesnej niepewności co do rozkładu nowej fizyki, i wreszcie rygorystyczna procedura walidacji zanim model trafi na produkcję. W zastosowaniach biznesowych rzadko mamy do czynienia z decyzjami nieodwracalnymi w takim tempie, ale architektura nadzoru nad modelem powinna być analogicznie staranna. Więcej o analogiach w roli człowieka w pętli.

Fizyka cząstek to dziedzina, w której AI jako asystent badacza wnosi realną wartość: przetwarza dane w tempie, które przekracza ludzkie możliwości, i rozpoznaje wzorce w przestrzeniach wielowymiarowych. Ale decyzja o tym, czy anomalia jest odkryciem, czy artefaktem, należy nadal do eksperta. Ten sam podział zadań obowiązuje w każdym wiarygodnym systemie AI. Więcej o tym, jak AI zmienia rolę naukowca bez zastępowania jego osądu, w artykule naukowcy z AI lepsi niż naukowcy bez AI. Jeśli interesuje cię, jak podobne systemy klasyfikacyjne budować z myślą o odpowiedzialności i przejrzystości, przeczytaj też LLM jako generator hipotez.

Powiązana realizacjadowodyIO — akta sprawy w audytowalny materiał dowodowy