ШІ у Великому адронному колайдері: як фільтрувати зіткнення

Великий адронний колайдер у CERN під час роботи генерує зіткнення протонів з частотою десятків мільйонів на секунду. Збереження сирих даних з кожного зіткнення фізично неможливе: пропускна здатність пам'яті та мережі не встигають. Тому система тригеру (trigger) має відкидати переважну більшість подій за кілька мікросекунд, перш ніж дані потраплять на диск. Десятиліттями це робило електронне обладнання, спроектоване під конкретні сигнатури частинок. Останні кілька років у деяких шарах цього конвеєра з'являються моделі машинного навчання. Вони не замінюють фізиків. Допомагають їм швидше відрізняти сигнал від шуму в даних зі структурою, яку ручні правила описують не повністю.

Чому фільтрування подій є обчислювальною проблемою

Зіткнення протонів у LHC породжує десятки вторинних частинок. Кожна з них залишає слід у кількох шарах детектора. Одна подія — це потоковий запис із сотень тисяч вимірювальних каналів. При десятках мільйонів зіткнень на секунду виникає потік даних, який навіть при агресивному стисненні вимірюється в терабайтах на секунду.

Традиційна система тригеру працює у два або три шари. Перший шар (Level-1 trigger) — це програмоване обладнання (FPGA), яке за кілька мікросекунд застосовує просте критерій: чи перевищує енергія, виміряна в певній області детектора, поріг? Події, які не пройшли цей тест, безповоротно відкидаються. Другий і третій шари працюють повільніше, але мають доступ до повнішої реконструкції сліду частинки і можуть застосовувати складніші критерії.

Проблема є структурною: вручну визначені порогові правила ефективні для процесів, які фізики можуть заздалегідь описати математично. Для рідкісних процесів, сигнатура яких близька до фону, правила або пропускають забагато шуму, або відкидають потенційно цікаві події. Тут на допомогу приходять моделі машинного навчання.

Що робить модель класифікації в системі тригеру

У кількох експериментах на LHC (зокрема, LHCb і ATLAS) тестуються нейронні мережі, впроваджені безпосередньо на мікросхемах FPGA або у швидкому програмному шарі одразу за Level-1. Модель отримує на вхід вектор ознак, що описують одну подію: енергії, імпульси, кути, ідентифікатори вторинних вершин. На виході генерує результат, що вказує, чи відповідає подія певному класу фізичних процесів.

Ключовий компроміс — час висновку. Модель має вкластися у часове вікно системи тригеру, часто менше кількох мікросекунд. Це виключає великі моделі. Використовувані архітектури — це мілкі повнозв'язні мережі або спеціалізовані графові мережі (для реконструкції слідів у 3D-просторі). Точність класифікації є вимірюваною і порівнянною з альтернативами: фізиків цікавить конкретно, скільки відсотків сигнальних подій модель пропускає і скільки відсотків фону помилково позначає як сигнал.

Наведена нижче таблиця порівнює три підходи до селекції подій в одному класі процесів:

Підхід	Ефективність сигналу	Частка фону (приблизно)	Час рішення
Ручні порогові правила	висока для відомих сигнатур	висока для нових процесів	кілька µs
Мілка нейронна мережа (FPGA)	порівнянна або вища	нижча на кільканадцять відсотків	1-3 µs
Графова нейронна мережа (CPU/GPU)	найвища в тестах	найнижча в тестах	10-100 µs

Цифри є приблизними і сильно залежать від конкретного фізичного каналу. Ми в Cashcrown не працюємо з детекторами частинок, але архітектура проблеми нам знайома: швидкий класифікатор як попередній фільтр, повільніший і дорожчий аналіз лише для подій, які пройшли фільтр.

Межі: чого модель не вміє

Кожна модель класифікації в тригері навчена на симуляціях Монте-Карло та даних, зібраних у попередніх сеансах (run-ах). Це означає, що модель розпізнає класи процесів, приклади яких були в навчальній вибірці. Подія з «нової фізики» (процесів, що виходять за межі Стандартної моделі) може мати сигнатуру, яку модель ніколи не бачила. У такій ситуації класифікатор з великою ймовірністю відкине цю подію як фон, оскільки вона не відповідає жодному шаблону, який він визнав за сигнал.

Це не дефект проекту. Це фундаментальне обмеження навчання з учителем: модель узагальнює на основі того, що бачила. Тому системи ШІ в тригері не замінюють існуючих правил. Вони працюють паралельно або в додатковому шарі, а частина пропускної здатності спеціально залишається для подій, відібраних випадково або класичними правилами, які виконують роль страхувальної сітки.

Друга проблема — дрейф детектора. Умови роботи LHC змінюються: світність зростає, матеріал детектора старіє, геометрія кабелів впливає на розподіл сигналів. Модель, навчена на даних з початку сезону вимірювань, може втрачати ефективність через кілька місяців. Observability системи ШІ в тригері вимагає постійного моніторингу розподілів вхідних ознак і показника прийняття, а не лише обчислювальної продуктивності.

Третя межа — витлумачуваність. Фізик, який виявив аномалію в даних, має вміти пояснити, чому подія була збережена тригером. Коли рішення прийняв класичний пороговий фільтр, пояснення тривіальне. Коли його прийняла нейронна мережа, фізик потребує інструментів для перевірки, чи не керувалася модель артефактною кореляцією замість фізичного сигналу.

Human-oversight: де експерт входить у цикл

Модель тригеру не працює у вакуумі. При кожному впровадженні нової моделі або зміні її параметрів діє процедура валідації фізиком, відповідальним за певний канал вимірювання. Перевіряється відповідність розподілів вихідних даних моделі симуляціям Монте-Карло, стабільність показника прийняття в часі та відсутність кореляції результату з артефактами детектора.

У великих колабораціях (ATLAS, CMS, LHCb) зміни в системі тригеру проходять внутрішню процедуру рецензування. Ніхто не впроваджує нову версію моделі між збором даних. Кожна зміна конфігурації тригеру точно датується і логується, оскільки це обумовлює коректність аналізу даних, зібраних до і після зміни.

Принцип human-oversight тут структурний: модель приймає оперативне рішення (зберегти подію чи ні), але валідація моделі, рішення про впровадження та інтерпретація результатів залишаються за експертом. Такий самий підхід ми застосовуємо в системах ШІ для клієнтів Cashcrown: жодна модель класифікації не потрапляє у продакшн без затвердженого golden-сету та визначених порогів ескалації до людини. Різниця в масштабі величезна, але архітектура нагляду аналогічна.

Варто зазначити, що human-oversight не уповільнює автоматично збір даних. Рішення тригеру приймаються в реальному часі без участі людини. Нагляд стосується валідації моделей та інтерпретації зібраних даних, а не кожної події окремо.

▶Оцініть проект системи тригеру для нового фізичного каналуsandbox · reasoning

Оцініть проект системи тригеру для нового фізичного каналу

PII maskowane · zero retencji

Напрямок: виявлення аномалій без етикеток

Окремим напрямком досліджень, що набирає обертів, є виявлення аномалій без учителя (unsupervised anomaly detection) як доповнення до класичних тригерів. Замість класифікації подій до відомих класів, модель навчається щільності розподілу фонових подій і позначає ті, що відхиляються від норми. Така система могла б, в принципі, зберігати події з невідомою сигнатурою, які ручні правила б не виявили.

Однак цей підхід значно складніший у валідації. Немає етикеток, тому немає прямої міри ефективності. Фізик має оцінити, чи події, позначені як аномалії, є фізично цікавими, чи є артефактами детектора. При тригері, що працює в реальному часі та обмеженій пропускній здатності запису, надто чутливий детектор аномалій завалить сховище шумом.

У наших впровадженнях подібна проблема виникає в системах виявлення шахрайства та моніторингу якості виробництва: модель, що виявляє аномалії, є корисною лише тоді, коли має визначені пороги ескалації та чіткий шлях до верифікації людиною. Без цього вона генерує alert fatigue, який зрештою вимикають. Стаття про проблему чорної скриньки детально розглядає, як будувати витлумачуваність у системах, рішення яких важко інтерпретувати.

FAQ

Чи може ШІ самостійно відкрити нову частинку в даних з LHC?

Ні, в автономному сенсі. Модель може вказати групу подій, що статистично відхиляються від очікуваного фону, але інтерпретація цього відхилення як сигналу нової фізики вимагає аналізу командою фізиків: перевірки систематичних ефектів, верифікації незалежними методами і, зрештою, підтверджуючого експерименту. ШІ прискорює попередній відбір кандидатів, але відкриття завжди є результатом людської праці.

Які моделі машинного навчання підходять для впровадження на FPGA в тригері?

Основні обмеження — час висновку та апаратні ресурси мікросхеми. На FPGA практично впроваджуваними є мілкі повнозв'язні мережі (кілька шарів, кілька десятків нейронів на шар) та прості дерева рішень, квантизовані до арифметики з фіксованою комою. Бібліотека hls4ml дозволяє синтезувати моделі з PyTorch/Keras безпосередньо в код HDL. Глибокі графові моделі працюють на GPU у програмному шарі тригеру вищого рівня, де часове вікно ширше.

Як дрейф детектора впливає на ефективність моделі і як з ним боротися?

Дрейф детектора означає, що розподіли вхідних ознак моделі змінюються з часом. Модель, навчена на даних з початку сезону, втрачає ефективність, коли світність зростає або коли геометрія детектора змінюється. Стандартний підхід — моніторинг розподілів ознак у реальному часі (data quality monitoring), регулярне перенавчання на найсвіжіших даних та підтримка версій моделі, строго прив'язаних до часового інтервалу збору даних.

Чи підпадають системи ШІ в тригері під дію AI Act?

Безпосередні наукові застосування в CERN, ймовірно, не підпадають під AI Act у категорії високого ризику, оскільки не впливають безпосередньо на рішення щодо людей (категорії з Додатка III). Однак кожна організація, що впроваджує системи ШІ, які підтримують регуляторні рішення або впливають на безпеку, має провести оцінку класифікації ризику. Для комерційних компаній, що впроваджують ШІ у подібних доменах (промисловість, медицина), відповідь може бути іншою, див. обов'язки компаній у 2026 році.

Чим відрізняється проблема фільтрування подій від типової бізнесової класифікації?

Основні відмінності: масштаб пропускної здатності (події кожні мікросекунди, а не секунди), відсутність можливості апеляції (відкинута подія втрачається назавжди), повний контроль над навчальними даними (симуляції) при одночасній невизначеності щодо розподілу нової фізики, і, нарешті, сувора процедура валідації перед потраплянням моделі у продакшн. У бізнес-застосуваннях рідко стикаються з незворотними рішеннями в такому темпі, але архітектура нагляду за моделлю має бути аналогічно ретельною. Більше про аналогії у ролі людини в циклі.

Фізика частинок — це галузь, в якій ШІ як асистент дослідника приносить реальну цінність: обробляє дані в темпі, що перевищує людські можливості, і розпізнає патерни у багатовимірних просторах. Але рішення про те, чи є аномалія відкриттям чи артефактом, як і раніше, належить експерту. Такий самий розподіл завдань діє в будь-якій надійній системі ШІ. Більше про те, як ШІ змінює роль науковця без заміни його судження, у статті науковці з ШІ кращі за науковців без ШІ. Якщо вас цікавить, як будувати подібні системи класифікації з урахуванням відповідальності та прозорості, прочитайте також LLM як генератор гіпотез.

Повʼязаний кейсdowodyIO — матеріали справи в аудитований доказовий матеріал

ШІ у Великому адронному колайдері: як фільтрувати зіткнення

Чому фільтрування подій є обчислювальною проблемою

Що робить модель класифікації в системі тригеру

Наведена нижче таблиця порівнює три підходи до селекції подій в одному класі процесів:

Підхід	Ефективність сигналу	Частка фону (приблизно)	Час рішення
Ручні порогові правила	висока для відомих сигнатур	висока для нових процесів	кілька µs
Мілка нейронна мережа (FPGA)	порівнянна або вища	нижча на кільканадцять відсотків	1-3 µs
Графова нейронна мережа (CPU/GPU)	найвища в тестах	найнижча в тестах	10-100 µs

Межі: чого модель не вміє

Human-oversight: де експерт входить у цикл

▶Оцініть проект системи тригеру для нового фізичного каналуsandbox · reasoning

Оцініть проект системи тригеру для нового фізичного каналу

PII maskowane · zero retencji

Напрямок: виявлення аномалій без етикеток

FAQ

Чи може ШІ самостійно відкрити нову частинку в даних з LHC?

Які моделі машинного навчання підходять для впровадження на FPGA в тригері?

Як дрейф детектора впливає на ефективність моделі і як з ним боротися?

Чи підпадають системи ШІ в тригері під дію AI Act?

Чим відрізняється проблема фільтрування подій від типової бізнесової класифікації?

Повʼязаний кейсdowodyIO — матеріали справи в аудитований доказовий матеріал