🟡 🤝 Agenten Samstag, 9. Mai 2026 · 2 Min. Lesezeit ·

arXiv:2605.06623: MASPO — automatische Prompt-Optimierung für Multi-Agenten-LLM-Systeme, ICML 2026

arXiv:2605.06623 ↗

Redaktionelle Illustration: Multi-Agenten-LLM-System-Diagramm mit Prompt-Optimierung durch evolutionäre Suche

MASPO ist ein Framework zur gemeinsamen Prompt-Optimierung in Multi-Agenten-LLM-Systemen mit evolutionärer Beam-Suche. Es erreicht durchschnittlich +2,9 Prozentpunkte auf sechs Aufgaben und wurde für ICML 2026 angenommen.

🤖

Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.

Ein Forschungsteam unter der Leitung von Zhexuan Wang und Xuebo Liu veröffentlichte am 7. Mai 2026 auf arXiv einen Beitrag über MASPO (Multi-Agent System Prompt Optimization) — ein Framework zur gemeinsamen Prompt-Optimierung in Multi-Agenten-LLM-Systemen. Der Beitrag wurde für ICML 2026 angenommen, und der Code ist auf GitHub unter der CC-BY-4.0-Lizenz verfügbar.

Welches Problem löst MASPO?

In Systemen mit mehreren kooperierenden LLM-Agenten hat jeder Agent seinen eigenen Prompt — doch die gemeinsame Optimierung aller Prompts bleibt ein schwieriges Problem aufgrund der Diskrepanz zwischen lokalen Agentenzielen und dem ganzheitlichen Systemziel. Traditionelle Ansätze bewerten Prompts isoliert, was Interaktionen zwischen Agenten verpasst und zu suboptimalen globalen Ergebnissen führen kann.

Wie funktioniert die gemeinsame Evaluierung?

MASPO misst einen Prompt nicht anhand seines isolierten Ergebnisses, sondern anhand seiner „Fähigkeit, den Erfolg nachgelagerter Agenten zu begünstigen”. Wenn ein Agent eine Ausgabe generiert, bewertet MASPO, wie sehr diese Ausgabe den nachfolgenden Agenten in der Kette hilft — und verbindet so lokale Interaktionen mit globalen Systemmetriken ohne markierte Daten. Die Optimierung nutzt evolutionäre Beam-Suche, die den hochdimensionalen Prompt-Raum dateneffizient navigiert.

Wie groß ist die Verbesserung in der Praxis?

Über sechs verschiedene Evaluierungsaufgaben erzielt MASPO durchschnittlich 2,9 Prozentpunkte Verbesserung in der Genauigkeit gegenüber den derzeit besten Prompt-Optimierungsmethoden. Die Autoren betonen, dass die Ergebnisse über Aufgaben hinweg konsistent sind, was darauf hindeutet, dass der Ansatz nicht von der spezifischen Anwendungsdomäne abhängt.

Was ist öffentlich verfügbar?

Neben dem arXiv-Preprint veröffentlichten die Autoren (Zhexuan Wang, Xuebo Liu, Li Wang, Zifei Shan, Yutong Wang, Zhenxi Song, Min Zhang) Quellcode auf GitHub, was die Reproduktion von Experimenten und die Anwendung auf neue Multi-Agenten-Konfigurationen ermöglicht.

Häufig gestellte Fragen

Was ist MASPO?
MASPO (Multi-Agent System Prompt Optimization) ist ein Framework, das Prompts im gesamten Multi-Agenten-LLM-System automatisch und iterativ verfeinert und jeden Prompt anhand des Erfolgs nachgelagerter Agenten bewertet.
Was ist die zentrale methodische Innovation?
Statt Prompts isoliert zu bewerten, misst MASPO, wie jeder Prompt den Erfolg nachgelagerter Agenten beeinflusst, und verbindet so lokale Ziele mit dem ganzheitlichen Systemziel — ohne markierte Daten.
Wie groß ist der Leistungsgewinn?
Über sechs Evaluierungsaufgaben erzielt MASPO durchschnittlich 2,9 Prozentpunkte Verbesserung in der Genauigkeit gegenüber den besten bestehenden Prompt-Optimierungsmethoden.