Multi-Agent-Systems-Survey: von klassischen Paradigmen zur Zukunft großer Sprachmodelle
Ein neuer arXiv-Survey verbindet umfassend die klassische Multi-Agent-Systems-Literatur mit dem modernen LLM-Agenten-Stack. Die Arbeit identifiziert einen Paradigmenwechsel in Koordination, Kommunikationsprotokollen und emergentем Verhalten — vom Austausch niedrigstufiger Zustände zum semantischen Reasoning.
Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.
Ein neuer arXiv-Survey von Zixiang Wang und Mitautoren, angenommen im IEEE/CAA Journal of Automatica Sinica, verbindet systematisch die klassische Literatur zu Multi-Agent-Systemen (MAS) mit modernen Ansätzen, die auf Large Foundation Models (LFMs) basieren. Am 20. April 2026 veröffentlicht, ist die Arbeit einer der ersten Versuche, einen Paradigmenwechsel formal zu dokumentieren.
Was bietet der klassische MAS-Rahmen?
Traditionelle MAS-Systeme organisieren Agenten entlang vier grundlegender Dimensionen: Wahrnehmung, Kommunikation, Entscheidungsfindung und Kontrolle. Diese Dimensionen bilden einen geschlossenen Koordinationsrahmen, in dem Agenten gegenseitig Zustände austauschen, über Rollen verhandeln und Aufgaben ausführen.
Der klassische Ansatz stützt sich auf steuerungstheoretische Grundlagen — mathematisch beweisbare Protokolle, feste Kommunikationsschemata und explizit modellierte Zustände. Beispiele umfassen Konsensalgorithmen für Drohnenschwärme, Auktionsprotokolle für die Aufgabenverteilung und Markov-Entscheidungsfindung in stochastischen Umgebungen.
Die Stärke dieses Ansatzes liegt in der Beweisbarkeit — wir können mathematisch Konvergenz, Stabilität und Optimalität garantieren. Die Schwäche liegt in der Starrheit — jede neue Aufgabe erfordert neue Modellierung.
Wie verändern LFMs das Bild?
Den Autoren zufolge ermöglichen LFMs den Agenten, „die Zusammenarbeit von einem niedrigstufigen Zustandsaustausch auf semantisches Reasoning anzuheben.” Anstatt numerische Vektoren zu senden, kommunizieren Agenten untereinander in natürlicher Sprache, teilen Kontext und schlussfolgern gemeinsam über Pläne.
Das bringt adaptive Koordinationsstrategien mit sich — Agenten können Protokolle ad hoc improvisieren, ohne vordefinierte Schemata über Rollen verhandeln und das gesamte Wissen des Grundlagenmodells bei der Zusammenarbeit nutzen. Die Arbeit hebt hervor, dass dieser Wandel analog zum Übergang von der Assemblersprache zur natürlichen Sprache in der menschlichen Kommunikation ist.
Der Survey vergleicht klassische und LFM-Ansätze hinsichtlich Architektur, Betriebsmechanismen, Anpassungspotenzial und realer Anwendungsszenarien.
Welche Forschungsrichtungen sind offen?
Die Autoren identifizieren mehrere Schlüsselherausforderungen für die Zukunft des Gebiets. Die erste ist Verifikation und Zuverlässigkeit — LFM-basierte Agenten verlieren die formalen Garantien klassischer Protokolle, was es schwer macht zu beweisen, dass sie nicht steckenbleiben oder schädliche Ergebnisse produzieren. Die zweite ist Kommunikationsskalierbarkeit — natürliche Sprache ist teuer, sie in Echtzeit zwischen Hunderten von Agenten auszutauschen.
Die dritte Herausforderung ist emergentes Verhalten — Koordination kann unerwartete Phänomene erzeugen, die nicht explizit programmiert wurden. Der Survey behandelt dies sowohl als Chance (Anpassungsfähigkeit) als auch als Risiko (Unvorhersehbarkeit). Die praktische Anwendung in Systemen wie autonomen Flotten oder verteilten KI-Assistenten wird eine Kombination beider Ansätze erfordern — das semantische Reasoning der LFMs und die formalen Garantien klassischer Protokolle.
Die Arbeit ist ein nützlicher Referenzleitfaden für alle, die an LLM-Agenten-Frameworks wie AutoGen, CrewAI oder LangGraph arbeiten, da sie deren Ideen in den Kontext jahrzehntelanger MAS-Forschung einbettet.
Häufig gestellte Fragen
- Was ist ein Multi-Agent-System (MAS)?
- Ein MAS ist ein System, in dem mehrere autonome Agenten kooperieren oder konkurrieren, um eine Aufgabe zu lösen, die für einen einzelnen Agenten zu groß ist. Traditionell eingesetzt in Robotik, Simulation und verteilten Systemen.
- Was ist ein Large Foundation Model (LFM) im MAS-Kontext?
- Ein LFM ist ein großes Grundlagenmodell wie GPT-5 oder Claude Opus, das als Gehirn des Agenten dient. Anstelle hart kodierter Regeln nutzt der Agent ein LFM für Reasoning, Planung und Kommunikation mit anderen Agenten.
- Warum ist semantische Kommunikation ein Fortschritt gegenüber klassischem MAS?
- Klassische MAS verwenden Low-Level-Protokolle — numerische Zustandsvektoren, Nachrichten-IDs, feste Schemata. LFM-basierte Agenten tauschen Nachrichten in natürlicher Sprache aus, was flexiblere Zusammenarbeit und schnellere Anpassung an neue Aufgaben ohne Umprogrammierung ermöglicht.
Quellen
Verwandte Nachrichten
arXiv:2605.22502: Kompilierung agentischer Workflows in LLM-Gewichte liefert Near-Frontier-Qualität bei 100× niedrigeren Kosten
arXiv:2605.22794: MOSS zeigt Agenten, die sich durch Umschreiben ihres eigenen Quellcodes verbessern
arXiv:2605.22535: TerminalWorld-Benchmark misst KI-Agenten auf echten Linux-Terminal-Aufgaben ohne Simulation