🤖 24 AI
🟢 🤝 Agenten Sonntag, 19. April 2026 · 3 Min. Lesezeit

Mind DeepResearch: ein Drei-Agenten-Framework erzielt Top-Ergebnisse bei Deep-Research-Aufgaben mit 30B-Modellen statt GPT-4-Skala

Redaktionelle Illustration: drei abstrakte Agenten, die in einem Forschungsprozess zusammenarbeiten, Netzwerkstruktur

Warum es wichtig ist

Mind DeepResearch (MindDR) ist ein neues Multi-Agenten-Framework für Deep Research, das mit Modellen von rund 30 Milliarden Parametern kompetitive Ergebnisse erzielt — der Größenklasse von Qwen2.5 oder DeepSeek, nicht GPT-4 oder Claude Opus. Architektur: Planning Agent + DeepSearch Agent + Report Agent mit einer vierstufigen Trainings-Pipeline einschließlich Data Synthesis, gemäß einem technischen Bericht vom 17. April 2026.

Was bringt Mind DeepResearch?

Mind DeepResearch (MindDR) ist ein neues Multi-Agenten-System, das am 17. April 2026 als technischer Bericht auf arXiv vorgestellt wurde. Es konzentriert sich auf eine der anspruchsvollsten KI-Kategorien — Deep Research — und behauptet, Top-Ergebnisse erzielen zu können, ohne Frontier-Modelle wie GPT-4 oder Claude Opus zu benötigen.

Deep Research ist eine Aufgabe, bei der ein KI-System selbständig ein komplexes Forschungsprojekt durchführt: durchsucht das Web, liest Quellen, synthetisiert verschiedene Perspektiven, bewertet die Zuverlässigkeit und erstellt einen Bericht auf Analystenebene. OpenAI Deep Research, Perplexity Deep Research, Gemini Deep Research — alle stützen sich auf Modelle mit hunderten Milliarden Parametern.

MindDR arbeitet mit ~30 Milliarden Parametern — der Klasse von Qwen2.5-32B oder DeepSeek V3-small — eine 10-mal günstigere Infrastruktur.

Drei-Agenten-Architektur

Das Paper beschreibt die Spezialisierung durch drei Agenten:

  1. Planning Agent — angesichts einer Benutzeranfrage zerlegt er die Aufgabe in konkrete Forschungs-Teilziele. Er fragt: „Was genau muss ich herausfinden und in welcher Reihenfolge?”

  2. DeepSearch Agent — führt die eigentliche Recherche durch. Er stellt Suchanfragen, liest Quellen, extrahiert Fakten und bewertet sie kritisch. Dies ist der „Runner”, der durch das Web geht.

  3. Report Agent — Synthese. Aus den gesammelten Informationen schreibt er einen abschließenden Bericht in strukturiertem Format, zitiert Quellen und balanciert Perspektiven.

Jeder Agent ist auf seinen Teil der Arbeit spezialisiert — im Gegensatz zu monolithischen Ansätzen, bei denen ein einziges Modell alles gleichzeitig erledigt.

Vierstufige Trainings-Pipeline

Ohne Skalenvorteil muss die Kompensation aus Daten und Training kommen. MindDR verwendet:

  1. Data-Synthesis-Phase — generiert synthetische Deep-Research-Aufgaben und gewünschte Trajektorien mithilfe eines stärkeren Modells (Destillation)
  2. SFT-Phase — Supervised Fine-Tuning auf synthetischen Daten
  3. Agentenspezifische RL-Phase — separates Reinforcement Learning für jeden der drei Agenten
  4. Integrationsphase — Fine-Tuning auf kombinierten Aufgaben, bei denen alle drei Agenten zusammenarbeiten

Der Ansatz ist im Post-Training-Bereich üblich, aber die Kombination aus Data Synthesis + agentenspezifischem RL + mehrstufiger Integration ist laut den Autoren konkret und reproduzierbar.

Warum ist das wichtig?

Zwei Gründe:

1. Demokratisierung des Zugangs. 30B-Modelle können auf Hardware im Wert von einigen tausend Euro selbst gehostet werden. GPT-4-Klasse erfordert API-Aufrufe oder massive GPU-Cluster. Wenn MindDR wirklich mit OpenAI Deep Research konkurriert, öffnet sich die Tür für On-Premise Deep Research für Branchen mit Datenschutzanforderungen (Rechts-, Finanz-, Medizinbereich).

2. Architektur vs. Skala. Der Mythos „größeres Modell = besseres Ergebnis” bekommt ein Gegenbeispiel. Spezialisierung durch Multi-Agenten-Design kann Skalennachteile kompensieren — nicht vollständig, aber ausreichend für praktische Aufgaben.

Was muss verifiziert werden?

Wie bei allen technischen Berichten ist eine unabhängige Überprüfung notwendig:

  • Reproduzierbarkeit — ist der Code verfügbar und sind die Ergebnisse wiederholbar?
  • Benchmark-Abdeckung — welche Deep-Research-Aufgaben wurden genau getestet? Die Autoren verwenden BrowseComp und ähnliche, aber die Abdeckung variiert
  • Robustheit — was passiert, wenn eine Webquelle hinter einer Paywall liegt? Was bei widersprüchlichen Quellen?

Aktuell ist MindDR ein vielversprechendes Signal, dass Deep Research zugänglicher werden kann — aber Zeit und die Gemeinschaft sind nötig, um zu beurteilen, wie gut es tatsächlich in der Praxis funktioniert.

🤖

Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.