Prelegent łączy w swoich badaniach i pracy zawodowej wiele dziedzin. Ma już za sobą kilka kierunków studiów, w tym jedne zakończone doktoratem (pełne rozwinięcie: dr n. med., mgr inż. inf., mgr psych., mgr biol. sąd., MBA). Zajmuje się opiniowaniem w sprawach dotyczących przestępczości seksualnej (ocena treści przedstawiających seksualne wykorzystywanie dzieci CSAM, diagnoza zaburzeń preferencji seksualnych, badania sądowo-informatyczne i antropologiczne), prowadzi badania naukowe w obszarze seksuologii, pracuje na Wydziale Informatyki Polsko- Japońskiej Akademii Technik Komputerowych (wykłada przedmioty związane z uczeniem maszynowym, językiem Swift), projektuje i koduje aplikacje specjalistyczne stosowane w kryminalistyce (w tym FenrirAI - narzędzie do detekcji CSAM z użyciem AI). Niniejszy referat poprzedza obronę (w przyszłym tygodniu) jego kolejnego doktoratu - procedowanego przez Radę Naukową Dziedzin UW.
Cel. Celem badań było stworzenie rozwiązania technologicznego integrującego modele uczenia maszynowego (klasyfikacji i detekcji) odpowiadającego wytycznym Komisji Europejskiej w zakresie wytłumaczalności przyczyn klasyfikacji modelu.
Metoda. Przeprowadzono wywiad technologiczny z przedstawicielami wymiaru sprawiedliwości, wskazano najbardziej pożądane funkcjonalności tworzonego rozwiązania technologicznego. Przeprowadzono badania prowadzące do wytrenowania możliwe najlepszych modeli uczenia maszynowego obejmujących zadania klasyfikacji binarnej, wieloklasowej oraz detekcji obiektów, tj. fragmentów ciała mających znaczenie przy analizie CSAM. Materiał treningowy, walidacyjny oraz zbiory testowe stanowiło łącznie 448.400 zdjęć, w tym 99.400 treści pornograficznych z udziałem małoletnich zabezpieczonych w toku spraw karnych. Przeprowadzono eksperymenty nad doborem możliwie najlepszej architektury sieci neuronowej. Dokonano modyfikacji algorytmu grad-CAM w celu uzyskania bardziej adekwatnego, z perspektywy klinicznej, wytłumaczenia dla klasyfikacji dokonywanej przez modele sieci.
Wyniki. Dokładność klasyfikacji na materiale testowym dla sieci a1 (klasyfikacja binarna zdjęć ze względu na ich jakość) wynosiła 98%; dla sieci a2 (klasyfikacja czteroklasowa, w tym CSAM) wynosiła 92%; dla sieci am (przygotowanej dla aplikacji mobilnej) dokładność wynosiła 85%. W przypadku modelu detekcji obiektów najwyższą czułością detekcji charakteryzowała się sylwetka kobiet dojrzałych seksualnie (71%).
Dyskusja. W wyniku prowadzonych badań stworzone zostało rozwiązanie informatyczne, które cechuje się wysoką dokładnością klasyfikacji CSAM. Zapewniono środowiska uruchomieniowe umożliwiające skorzystanie z rozwiązania pracownikom wymiaru sprawiedliwości, w tym wersję desktopową oraz aplikację mobilną.
Podsumowanie. Z uwagi na satysfakcjonujące wyniki metryk uzyskane na materiale testowym oraz wprowadzoną modyfikację algorytmu grad-CAM, zaprezentowane rozwiązanie można uznać za zapewniające wystarczające wyjaśnienie dokonywanej predykcji do zastosowania w praktyce klinicznej, realizujące wytyczne Komisji Europejskiej w zakresie wyjaśnialności AI.