ArXiv: Mathematischer Beweis der Unmöglichkeit vollständiger Verantwortlichkeit in Mensch-KI-Kollektiven
Warum es wichtig ist
Der Forscher Tibebu beweist ein formales Unmöglichkeitsresultat: Oberhalb einer bestimmten Autonomieschwelle von KI-Agenten können in Systemen, die Menschen und KI kombinieren, nicht alle vier Eigenschaften der Verantwortlichkeit gleichzeitig gelten.
Ein theoretischer Rahmen für Regulierer
Während die öffentliche Debatte über KI-Verantwortlichkeit meist auf intuitiver Ebene geführt wird („jemand muss schuld sein”), nähert sich Autor Tibebu dem Problem formal. Die Arbeit The Accountability Horizon, veröffentlicht am 10. April auf ArXiv, beweist ein Unmöglichkeitstheorem für Systeme, die Menschen und KI-Agenten kombinieren.
Vier Eigenschaften der Verantwortlichkeit
Tibebu definiert vier Eigenschaften, die wir von jedem „verantwortlichen” soziotechnischen System erwarten:
- Attribution — Für jede Handlung muss ein identifizierbarer Akteur existieren
- Verständlichkeit — Die Gründe einer Entscheidung müssen für eine Aufsichtsinstanz nachvollziehbar sein
- Sanktionierbarkeit — Es muss einen Mechanismus zur Bestrafung falscher Entscheidungen geben
- Korrigierbarkeit — Das System muss aus Fehlern lernen und sie nicht wiederholen können
Das Hauptergebnis
Oberhalb einer bestimmten Autonomieschwelle von KI-Agenten (der Autor nennt sie „Verantwortungshorizont”) können nicht alle vier Eigenschaften gleichzeitig gelten. Mit anderen Worten: Je mehr Autonomie wir KI-Systemen einräumen, desto weniger sinnvoll können wir von Verantwortlichkeit sprechen.
Konkrete Beispiele für Spannungen:
- Attribution wird schwächer, wenn mehrere Agenten sich koordinieren (siehe ACIArena-Arbeit vom selben Tag)
- Verständlichkeit wird schwächer, wenn Agenten latente Repräsentationen verwenden, die nicht menschlichen Konzepten entsprechen
- Sanktionierbarkeit wird schwächer, wenn Entscheidungen verteiltes Rechnen einbeziehen
- Korrigierbarkeit wird schwächer, wenn RLHF-Updates unvorhersehbare Nebenwirkungen haben
Implikationen für den EU AI Act und andere Regulierungen
Die Arbeit hat praktische Folgen für Regulierungen, die versuchen, die Verantwortung zwischen Entwicklern, Deployern und Nutzern von KI-Systemen zu „verteilen”. Tibebu legt nahe, dass solche Versuche nicht gelingen können, wenn die Autonomie eine bestimmte Schwelle überschreitet — und dass Regulierer harte Obergrenzen für das Autonomieniveau setzen sollten, statt zu versuchen, Verantwortung nachträglich zu verteilen.