ArXiv: matematički dokaz nemogućnosti potpune odgovornosti u ljudsko-AI kolektivima

Teorijski okvir za regulatore

Dok se rasprava o AI odgovornosti vodi u javnosti najčešće na razini intuicija (“netko mora biti kriv”), autor Tibebu pristupa problemu s formalne strane. Rad The Accountability Horizon, objavljen 10. travnja na ArXivu, dokazuje impossibility teorem za sustave koji kombiniraju ljude i AI agente.

Četiri svojstva odgovornosti

Tibebu definira četiri svojstva koje očekujemo od svakog “odgovornog” sociotehnologičkog sustava:

Atribucija — Za svaku akciju mora postojati identifikabilan akter
Razumljivost — Razlozi odluke moraju biti razumljivi nadzornoj instanci
Sankcionabilnost — Mora postojati mehanizam za kažnjavanje pogrešnih odluka
Korektivnost — Sustav mora biti sposoban naučiti iz pogrešaka i ne ponavljati ih

Glavni teorem

Iznad određenog praga autonomije AI agenata (autor ga zove “horizont odgovornosti”), ne mogu sva četiri svojstva istovremeno vrijediti. Drugim riječima, što više autonomije dajemo AI sustavima, to manje možemo smisleno govoriti o odgovornosti.

Konkretni primjeri tenzija:

Atribucija slabi kad više agenata koordiniraju (vidi ACIArena rad iz istog dana)
Razumljivost slabi kad agenti koriste latentne reprezentacije koje ne odgovaraju ljudskim konceptima
Sankcionabilnost slabi kad odluke uključuju distribuirano računanje
Korektivnost slabi kad RLHF-ovi update-i imaju nepredvidive bočne efekte

Implikacije za EU AI Act i druge regulative

Rad ima praktične posljedice za regulative koje pokušavaju “razdvojiti” odgovornost između developera, deployeera i korisnika AI sustava. Tibebu sugerira da takvi pokušaji ne mogu uspjeti ako autonomija pređe određeni prag — i da bi regulatori trebali postaviti tvrde gornje granice na razinu autonomije, umjesto pokušaja distribucije odgovornosti post-hoc.

ArXiv: matematički dokaz nemogućnosti potpune odgovornosti u ljudsko-AI kolektivima

Teorijski okvir za regulatore

Četiri svojstva odgovornosti

Glavni teorem

Implikacije za EU AI Act i druge regulative

Izvori

Povezane vijesti