ArXiv: matematički dokaz nemogućnosti potpune odgovornosti u ljudsko-AI kolektivima
Zašto je bitno
Istraživač Tibebu dokazuje formalan impossibility rezultat: iznad određenog praga autonomije AI agenata, ne mogu istovremeno vrijediti sva četiri svojstva odgovornosti u sustavima koji kombiniraju ljude i AI.
Teorijski okvir za regulatore
Dok se rasprava o AI odgovornosti vodi u javnosti najčešće na razini intuicija (“netko mora biti kriv”), autor Tibebu pristupa problemu s formalne strane. Rad The Accountability Horizon, objavljen 10. travnja na ArXivu, dokazuje impossibility teorem za sustave koji kombiniraju ljude i AI agente.
Četiri svojstva odgovornosti
Tibebu definira četiri svojstva koje očekujemo od svakog “odgovornog” sociotehnologičkog sustava:
- Atribucija — Za svaku akciju mora postojati identifikabilan akter
- Razumljivost — Razlozi odluke moraju biti razumljivi nadzornoj instanci
- Sankcionabilnost — Mora postojati mehanizam za kažnjavanje pogrešnih odluka
- Korektivnost — Sustav mora biti sposoban naučiti iz pogrešaka i ne ponavljati ih
Glavni teorem
Iznad određenog praga autonomije AI agenata (autor ga zove “horizont odgovornosti”), ne mogu sva četiri svojstva istovremeno vrijediti. Drugim riječima, što više autonomije dajemo AI sustavima, to manje možemo smisleno govoriti o odgovornosti.
Konkretni primjeri tenzija:
- Atribucija slabi kad više agenata koordiniraju (vidi ACIArena rad iz istog dana)
- Razumljivost slabi kad agenti koriste latentne reprezentacije koje ne odgovaraju ljudskim konceptima
- Sankcionabilnost slabi kad odluke uključuju distribuirano računanje
- Korektivnost slabi kad RLHF-ovi update-i imaju nepredvidive bočne efekte
Implikacije za EU AI Act i druge regulative
Rad ima praktične posljedice za regulative koje pokušavaju “razdvojiti” odgovornost između developera, deployeera i korisnika AI sustava. Tibebu sugerira da takvi pokušaji ne mogu uspjeti ako autonomija pređe određeni prag — i da bi regulatori trebali postaviti tvrde gornje granice na razinu autonomije, umjesto pokušaja distribucije odgovornosti post-hoc.