arXiv: FALAT sucht Ursache des KI-Agenten-Fehlers

FALAT ist ein neues Diagnose-Framework zur Zuordnung der Ursachen von Fehlern in Multi-Agenten-LLM-Systemen, formuliert als abhängigkeitsgeführte Suche. Es erreicht 46,0% Genauigkeit auf Schrittebene bei algorithmisch generierten Trajektorien und 29,1% bei manuell erstellten und zeigt, dass die Berücksichtigung von Abhängigkeiten zwischen Schritten entscheidend für die Identifizierung der Fehlerursache ist.

Eine auf arXiv veröffentlichte Arbeit mit dem Titel “FALAT: Tracing Failures in LLM Agent Trajectories via Dependency-Guided Search” stellt ein Diagnose-Framework für eines der schwierigsten Probleme in Multi-Agenten-Systemen vor. Die Autoren sind Md Nakhla Rafi, Md Ahasanuzzaman, Dong Jae Kim, Zhijie Wang und Tse-Hsun Chen.

Welches Problem löst FALAT?

In Systemen, in denen mehrere LLM-Agenten an einer Aufgabe zusammenarbeiten, lässt sich ein Fehler nicht leicht zuordnen. Ein Fehler kann sich durch eine Trajektorie ausbreiten: Spätere Aktionen sehen falsch aus, aber nur, weil sie von einem zuvor beschädigten Zustand abhängen. Eine Trajektorie ist hier die gesamte Folge von Schritten und Entscheidungen, die die Agenten treffen. FALAT versucht festzustellen, welcher Agent den Fehler tatsächlich verursacht hat und in welchem Schritt der entscheidende Fehler entstand.

Wie funktioniert FALAT?

Das Framework ist als “dependency-guided search” formuliert, eine durch Abhängigkeiten geführte Suche. FALAT bildet zunächst Erwartungen über die korrekte Ausführung der Aufgabe, identifiziert dann verdächtige Regionen der Trajektorie, verfolgt die Abhängigkeiten zwischen Entscheidungen und Ausgaben und beurteilt, ob die Korrektur eines Kandidatenschritts das erwartete Ergebnis wiederherstellen würde. Auf diese Weise gelangt man, statt oberflächlich auf den letzten sichtbaren falschen Schritt zu blicken, zur tatsächlichen Quelle des Fehlers.

Wie sind die Ergebnisse?

Auf dem Referenz-Benchmark Who&When erreicht FALAT 46,0% Genauigkeit auf Schrittebene bei algorithmisch generierten Trajektorien und 29,1% bei manuell erstellten. Diese Zahlen übertreffen spezialisierte Baseline-Methoden zur Attribution sowie das direkte Prompting eigenständiger LLM-Modelle. Der Unterschied zwischen den beiden Sätzen zeigt auch, wie viel schwieriger die Aufgabe bei manuell zusammengestellten, vielfältigeren Trajektorien ist.

Warum ist das wichtig?

Die Ergebnisse betonen, dass abhängigkeitsbewusstes Schlussfolgern entscheidend für die Diagnose von Fehlern in LLM-Agenten-Systemen ist. Da sich Agenten-Systeme in die Produktion ausbreiten, wird die Fähigkeit, die Ursache eines Fehlers präzise zuzuordnen, zur Voraussetzung für Zuverlässigkeit, Fehlerbehebung und Verantwortlichkeit. FALAT bietet einen strukturierten Ansatz für diese Herausforderung statt bloßen Ratens, welcher Schritt versagt hat.

Häufig gestellte Fragen

Was versucht FALAT festzustellen?

FALAT versucht festzustellen, welcher Agent den Fehler in einem Multi-Agenten-LLM-System verursacht hat und in welchem Schritt der entscheidende Fehler entstand.

Welche Genauigkeit erreicht FALAT?

Es erreicht 46,0% Genauigkeit auf Schrittebene bei algorithmisch generierten Trajektorien und 29,1% bei manuell erstellten und übertrifft damit spezialisierte Baseline-Methoden und direktes Prompting.

arXiv:2606.00765: FALAT verfolgt die Ursachen von Fehlern in Trajektorien von KI-Agenten

Welches Problem löst FALAT?

Wie funktioniert FALAT?

Wie sind die Ergebnisse?

Warum ist das wichtig?

Häufig gestellte Fragen

Quellen

Verwandte Nachrichten