Wyobraź sobie typowy scenariusz: zespół badawczy pracujący z danymi LiDAR dla trudno dostępnego regionu otrzymuje od algorytmu listę kilkudziesięciu potencjalnych lokalizacji osad niewidocznych na zdjęciach lotniczych. Część z nich potwierdzą badania terenowe, część okaże się naturalnymi formacjami lub fałszywymi trafieniami wynikającymi ze specyfiki danych treningowych. Proporcje zależą od jakości danych i regionu. Ten wzorzec jest jednocześnie imponujący i pouczający: AI przyspiesza selekcję kandydatów, ale człowiek musi pojechać na miejsce i sprawdzić.
W Cashcrown obserwujemy podobny wzorzec we wszystkich dziedzinach, gdzie stosujemy algorytmy do analizy danych badawczych. Szybkość i skala po stronie modelu, ocena i decyzja po stronie eksperta.
Jakie dane przetwarza AI w archeologii
#Materiał, z którym pracują algorytmy w archeologii, jest bardziej zróżnicowany niż w większości dziedzin naukowych.
Zobrazowania zdalne. Dane LiDAR, zdjęcia satelitarne w podczerwieni, fotografia lotnicza z dronów. Modele wizji komputerowej, szczególnie sieci konwolucyjne, wykrywają w tych danych anomalie terenu i regularności geometryczne, które sugerują obecność struktur pod powierzchnią lub pod roślinnością.
Zapisy ceramiki i artefaktów. Fotografie, skany 3D, wymiary i skład materiałowy. Klasyfikator wytrenowany na tysiącach opisanych fragmentów ceramiki potrafi przypisać nowe znalezisko do kultury, okresu i funkcjonalnej grupy w czasie, który ręcznie zajmowałby tygodnie.
Dane środowiskowe i GIS. Ukształtowanie terenu, bliskość źródeł wody, skład gleby, historyczne mapy zasięgu roślinności. Modele predykcyjne łączą te warstwy, żeby wskazać obszary o podwyższonym prawdopodobieństwie znalezisk.
Teksty i inskrypcje. Optyczne rozpoznawanie znaków i modele językowe wspomagają odczyt częściowo uszkodzonych inskrypcji i tabliczek. To zadanie, w którym AI działa jako propozycja, a epigraf lub filolog klasyczny podejmuje ostateczną decyzję.
Gdzie algorytm faktycznie pomaga
#Warto oddzielić zastosowania, które działają powtarzalnie, od tych, które są jeszcze eksperymentalne.
| Zastosowanie | Dojrzałość | Rola człowieka |
|---|---|---|
| Klasyfikacja ceramiki na podstawie zdjęć | Dojrzałe, produkcyjne | Weryfikacja próbki, zarządzanie wyjątkami |
| Wykrywanie anomalii LiDAR | Dojrzałe, szeroko stosowane | Walidacja terenowa przed ogłoszeniem odkrycia |
| Predykcja lokalizacji stanowisk z danych GIS | Sprawdzone w ograniczonych regionach | Selekcja priorytetów badań, decyzja o wykopaliskach |
| Fotogrametria i rekonstrukcja 3D | Dojrzałe | Interpretacja kulturowa i chronologiczna |
| Odczyt uszkodzonych inskrypcji | Eksperymentalne | Epigraf zatwierdza lub odrzuca każdą propozycję |
| Datowanie na podstawie stylu artefaktów | Eksperymentalne | Badacz porównuje z kontekstem stratygraficznym |
Wspólny mianownik: im bardziej zadanie polega na rozpoznawaniu wzorców w dużych, jednorodnych zbiorach danych, tym lepiej radzi sobie model. Im bardziej wymaga zrozumienia kontekstu kulturowego, intencji, narracji lub etycznego wymiaru znaleziska, tym bardziej niezastąpiony jest człowiek.
Jak wygląda pipeline od danych do kandydata
#Typowy cykl analizy wspierany przez AI nie zastępuje metodologii badań. Wbudowuje się w nią jako warstwa przyspieszająca.
Dane wejściowe przechodzą przez preprocessing: normalizację rozdzielczości zobrazowań, georeferencję, uzupełnienie brakujących wartości w danych środowiskowych. Następnie model ekstrakcji cech zamienia surowe piksele lub pomiary na reprezentacje liczbowe, które można porównywać.
Na tej reprezentacji działa właściwy algorytm: klasyfikator dla artefaktów, model predykcji przestrzennej dla lokalizacji stanowisk, detektor anomalii dla zobrazowań. Wynikiem jest lista kandydatów z przypisanym poziomem pewności, nie lista faktów.
Poziom pewności jest tutaj kluczowy. Dobry system informuje badacza nie tylko, co zaproponował, ale też jak daleko propozycja jest od rozkładu danych treningowych. Wynik spoza tego rozkładu to sygnał, że model operuje w obszarze, gdzie jego kalibracja jest niepewna. W naszych wdrożeniach taki sygnał trafia do użytkownika jako adnotacja, nie jest ukrywany.
Granice modeli i miejsca, gdzie archeolog decyduje
#Halucynacje w kontekście archeologii to nie tylko problem techniczny. Fałszywie pozytywna predykcja stanowiska może skierować ograniczone zasoby badawcze w złe miejsce. Błędna klasyfikacja artefaktu może utrwalić się w literaturze i być cytowana przez kolejne systemy uczące się na tej samej literaturze.
Kilka ograniczeń, o których warto pamiętać projektując system:
Stronniczość danych treningowych. Modele uczą się na tym, co zostało już odkryte i opisane. Obszary słabiej przebadane, kultury mniej reprezentowane w zbiorach danych i artefakty odbiegające od dobrze znanych typów będą klasyfikowane gorzej. To nie jest błąd algorytmu, to jest lustro danych wejściowych.
Brak rozumowania kontekstualnego. Model nie wie, że określona konfiguracja ceramiki w danym regionie ma znaczenie rytualne, a nie użytkowe. Nie zinterpretuje znaleziska w świetle powiązań z sąsiednimi kulturami. To zadanie eksperta.
Wrażliwość na jakość danych. Zobrazowania z różnych czujników, różnych sezonów i różnych rozdzielczości mogą dawać niespójne wyniki nawet dla tego samego obszaru. Preprocessing decyduje o wiarygodności wyniku bardziej niż wybór architektury modelu.
Zgodnie z zasadami, które stosujemy w naszych projektach, każdy wynik modelu, który ma wpływ na decyzję o wykopaliskach lub klasyfikację znaleziska w rejestrze dziedzictwa, przechodzi przez human-oversight: weryfikację przez uprawnionego badacza z dokumentowanym uzasadnieniem. To nie spowalnia badań. To jest standard, bez którego wyniki nie trafiają do publikacji.
Kwestia danych i odpowiedzialność za dziedzictwo
#Dane archeologiczne mają szczególny status. Informacje o lokalizacji stanowisk, jeśli staną się publiczne bez odpowiednich zabezpieczeń, mogą prowadzić do rabunkowych wykopalisk. Skany 3D obiektów sakralnych i artefaktów kulturowych społeczności rdzennych wymagają odrębnych protokołów zgody, których żaden model nie egzekwuje samodzielnie.
W praktyce oznacza to kilka wymogów przy projektowaniu systemu:
Zbiory danych z opisami lokalizacji przechowywane są z ograniczonym dostępem, oddzielone od modelu analizy. Model pracuje na reprezentacjach, nie na surowych współrzędnych GPS przekazywanych przez otwarte API.
Audyt stronniczości zbiorów treningowych jest częścią dokumentacji projektu. Jeśli dane treningowe pochodzą z określonych regionów lub typów stanowisk, jest to jawnie dokumentowane, a wyniki dla słabiej reprezentowanych obszarów są oznaczane jako mniej wiarygodne.
Społeczności potomne mają prawo do określenia, jakie dane dotyczące ich dziedzictwa mogą być przetwarzane i w jakim celu. System AI nie zastępuje tej konsultacji.
Powiązane zagadnienia dotyczące wyjaśnialności modeli i odpowiedzialności za wyniki omawiamy szerzej w kontekście problemu czarnej skrzynki oraz odpowiedzialnej innowacji.
FAQ
#Czy AI może samodzielnie potwierdzić odkrycie archeologiczne?
#Nie. Model może zaproponować lokalizację lub klasyfikację z określonym poziomem pewności, ale potwierdzenie odkrycia wymaga walidacji terenowej albo analizy laboratoryjnej przez uprawnionego badacza. Standardy publikacyjne i wymogi rejestrów dziedzictwa kulturowego wymagają dokumentacji metodologicznej, której model samodzielnie nie dostarcza.
Jakie typy artefaktów AI klasyfikuje najskuteczniej?
#Najlepsze wyniki osiąga się dla artefaktów z dużymi, dobrze opisanymi zbiorami treningowymi: ceramika (kształt, ornament, skład), narzędzia krzemienne (technika odłupywania, typ), monety i pieczęcie (ikonografia, inskrypcje). Skuteczność spada dla artefaktów organicznych, obiektów ze słabo reprezentowanych kultur i znalezisk, gdzie decyduje mikrokontekst stratygraficzny, a nie same cechy wizualne.
Czy modele predykcyjne stanowisk nadają się do każdego regionu?
#Modele wytrenowane na jednym regionie nie przenoszą się bezpośrednio do innego o odmiennej geologii, historii zasiedlenia lub dostępności danych. Transfer learning pozwala adaptować model przy ograniczonej liczbie znanych stanowisk w nowym obszarze, ale wymaga weryfikacji na lokalnym zbiorze testowym przed użyciem do kierowania decyzjami badawczymi. Precyzja na zbiorze treningowym nie jest gwarancją skuteczności w terenie.
Jak AI Act wpływa na stosowanie algorytmów w archeologii?
#Systemy AI stosowane w procesach decyzyjnych dotyczących dziedzictwa kulturowego i rejestrów urzędowych mogą podlegać wymogom systemów wysokiego ryzyka lub istotnego wpływu na prawa kulturalne. Oznacza to obowiązek dokumentacji technicznej, oceny ryzyka i możliwości audytu. Systemy czysto wspomagające, które nie generują decyzji administracyjnych, mają łagodniejsze wymogi, ale wymóg wyjaśnialności wyników pozostaje dobrą praktyką niezależnie od regulacji.
Jak odróżnić użyteczny system AI od narzędzia, które tylko przesuwa problem?
#Użyteczny system zmniejsza czas pracy eksperckiej przy zachowaniu lub poprawie jakości klasyfikacji. Sygnały ostrzegawcze: brak informacji o poziomie pewności w wyniku, brak audytu stronniczości danych treningowych, brak ścieżki do weryfikacji propozycji modelu przez człowieka. Jeśli system dostarcza wyniki bez adnotacji o ograniczeniach, przenosi ciężar weryfikacji na badacza bez dawania mu narzędzi do tej weryfikacji. Więcej o tym wzorcu w artykule o roli człowieka w procesach AI.
Wzorzec, który widzimy w archeologii, jest spójny z tym, co opisujemy w kontekście AI jako asystenta naukowego i pracy naukowców z AI: szybkość i skala po stronie algorytmu, ocena i odpowiedzialność po stronie człowieka. Jeśli planujesz wdrożyć podobny system do analizy danych badawczych w swojej organizacji, narzędzie oceny gotowości pomoże zidentyfikować luki przed rozpoczęciem budowy.
