arXiv:2604.21854 'Bounding the Black Box': statistički okvir za certifikaciju visokorizičnih AI sustava prema EU AI Aktu
Zašto je bitno
Natan Levy i Gadi Perl objavili su 23. travnja 2026. na ArXivu rad koji popunjava regulatornu prazninu EU AI Akta, NIST okvira i Konvencije Vijeća Europe. Predlažu dvostepeni statistički okvir s alatima RoMA i gRoMA koji izračunavaju revizibilnu gornju granicu stope kvarova bez pristupa unutarnjoj strukturi modela.
Istraživači Natan Levy i Gadi Perl objavili su 23. travnja 2026. na ArXivu rad pod naslovom “Bounding the Black Box” (arXiv:2604.21854), u kojem se izravno hvataju u koštac s problemom koji već dvije godine muči i regulatore i industriju — kako dokazati da je visokorizični AI sustav dovoljno siguran kad nijedan zakon ne kaže što “dovoljno siguran” znači u brojkama.
Rad je dugačak 11 stranica i dolazi u trenutku kada EU AI Act ulazi u operativnu primjenu, a hrvatski Hanfa, ministarstva i veće tvrtke moraju početi raditi conformity assessmente za svoje AI sustave bez jasnog metodološkog uporišta.
Koja je točno regulatorna praznina?
Autori formuliraju problem oštro i precizno. Tri ključna regulatorna instrumenta — EU AI Act, NIST Risk Management Framework (RMF) i Konvencija Vijeća Europe o AI-ju, ljudskim pravima i vladavini prava — svi zahtijevaju da operatori visokorizičnih sustava dokažu sigurnost prije puštanja u rad. Međutim, kako autori doslovno navode: “none specifies what ‘acceptable risk’ means in quantitative terms, and none provides a technical method for verifying that a deployed system actually meets such a threshold.”
Drugim riječima, regulator traži dokaz, ali ne kaže ni što treba dokazati ni kako. To stvara pravnu nesigurnost za obveznike i otvara prostor za “compliance theater” — papirnate procjene rizika bez stvarne mjere kvalitete.
Kako izgleda predloženi dvostepeni okvir?
Levy i Perl predlažu okvir inspiriran zrakoplovnim sigurnosnim protokolima, gdje se sigurnost ne dokazuje nadom nego mjerenjem stope kvarova ispod unaprijed definiranog praga.
Prva faza — politička. Nadležno tijelo (u EU kontekstu to bi bilo nacionalno regulatorno tijelo ili Europski AI ured) formalno utvrđuje dvije vrijednosti: prihvatljivu vjerojatnost kvara označenu sa δ (delta) i operativnu domenu ulaza označenu sa ε (epsilon). Ovaj korak je politička i pravna odluka, ne tehnička — tko god ima ovlast definirati “prihvatljivo”, taj postavlja prag.
Druga faza — tehnička. Statistički alati RoMA i gRoMA izračunavaju revizibilnu gornju granicu stvarne stope kvarova sustava na zadanoj domeni ε. Ako gornja granica padne ispod δ, sustav prolazi certifikaciju. Ako ne padne, ne prolazi.
Zašto je RoMA pristup posebno važan za zatvorene modele?
Ključna tehnička odlika RoMA i gRoMA alata, prema sažetku, jest da rade bez pristupa unutarnjoj strukturi modela. Auditor ne treba težine, gradijente ni arhitektonske detalje — radi s ulaznim i izlaznim podacima i izračunava statističku granicu kvarova.
To je presudno za europsko tržište jer većina visokorizičnih sustava koji će padati pod EU AI Act bit će komercijalni zatvoreni modeli (OpenAI, Anthropic, Google, Mistral). Bilo kakva certifikacijska metoda koja zahtijeva pristup težinama u praksi je neprimjenjiva. RoMA omogućuje treću stranu da provede smislenu verifikaciju i nad black-box sustavom.
Što ovo znači za hrvatske obveznike i regulatore?
Za hrvatske tvrtke koje razvijaju ili integriraju visokorizične AI sustave (zdravstvo, financije, HR procesi, kritična infrastruktura), rad nudi konkretan tehnički predložak za vlastite procjene sukladnosti dok regulator još ne objavi vlastite smjernice. Pristup je također koristan kao pregovaračka pozicija prema dobavljačima — moguće je tražiti od proizvođača modela da pruži statističke evidencije izračunate RoMA-stilom umjesto generičkih “model card” izjava.
Za regulatorna tijela poput AZOP-a i potencijalnog budućeg AI nadzornog tijela u Hrvatskoj, rad nudi metodološku polaznu točku koja je akademski objavljena, recenzirana i tehnički dovoljno specifična da se može preuzeti u podzakonske akte. Sažetak ne navodi konkretne p-value pragove ni studije slučaja, što znači da puni tekst rada treba pročitati prije implementacije, ali smjer je jasan: kvantitativna certifikacija AI sigurnosti više nije teorijski nego operativan izazov.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
Povezane vijesti
OpenAI objavio dokument 'Our principles': pet temeljnih načela koja vode put prema AGI-u
Anthropic ažurirao izborne sigurnosne mjere: Claude Opus 4.7 i Sonnet 4.6 postižu 95-96 posto na evaluacijama političke neutralnosti
arXiv:2604.21430: kratki chatbot razgovori trajno mijenjaju moralne sudove korisnika — empirijska studija na 53 ispitanika