Warum ist die 30B-Skala wichtig?

Deep Research wurde bisher von der GPT-4/Claude-Opus-Klasse dominiert (hunderte Milliarden Parameter). 30B-Modelle sind 10× günstiger im Inference und können selbst gehostet werden. Wenn die Architektur die Skala kompensiert, wird der Zugang demokratisiert.

Mind DeepResearch: Top-Ergebnisse mit 30B-Modellen

Q: Was ist ein Deep-Research-Agent?

Ein Deep-Research-Agent ist ein KI-System, das selbständig komplexe, langfristige Forschungsaufgaben durchführt — durchsucht das Web, liest Quellen, synthetisiert Informationen und schreibt einen Bericht im Stil eines Analysten, was Minuten bis Stunden dauern kann.

Was bringt Mind DeepResearch?

Mind DeepResearch (MindDR) ist ein neues Multi-Agenten-System, das am 17. April 2026 als technischer Bericht auf arXiv vorgestellt wurde. Es konzentriert sich auf eine der anspruchsvollsten KI-Kategorien — Deep Research — und behauptet, Top-Ergebnisse erzielen zu können, ohne Frontier-Modelle wie GPT-4 oder Claude Opus zu benötigen.

Deep Research ist eine Aufgabe, bei der ein KI-System selbständig ein komplexes Forschungsprojekt durchführt: durchsucht das Web, liest Quellen, synthetisiert verschiedene Perspektiven, bewertet die Zuverlässigkeit und erstellt einen Bericht auf Analystenebene. OpenAI Deep Research, Perplexity Deep Research, Gemini Deep Research — alle stützen sich auf Modelle mit hunderten Milliarden Parametern.

MindDR arbeitet mit ~30 Milliarden Parametern — der Klasse von Qwen2.5-32B oder DeepSeek V3-small — eine 10-mal günstigere Infrastruktur.

Drei-Agenten-Architektur

Das Paper beschreibt die Spezialisierung durch drei Agenten:

Planning Agent — angesichts einer Benutzeranfrage zerlegt er die Aufgabe in konkrete Forschungs-Teilziele. Er fragt: „Was genau muss ich herausfinden und in welcher Reihenfolge?”
DeepSearch Agent — führt die eigentliche Recherche durch. Er stellt Suchanfragen, liest Quellen, extrahiert Fakten und bewertet sie kritisch. Dies ist der „Runner”, der durch das Web geht.
Report Agent — Synthese. Aus den gesammelten Informationen schreibt er einen abschließenden Bericht in strukturiertem Format, zitiert Quellen und balanciert Perspektiven.

Jeder Agent ist auf seinen Teil der Arbeit spezialisiert — im Gegensatz zu monolithischen Ansätzen, bei denen ein einziges Modell alles gleichzeitig erledigt.

Vierstufige Trainings-Pipeline

Ohne Skalenvorteil muss die Kompensation aus Daten und Training kommen. MindDR verwendet:

Data-Synthesis-Phase — generiert synthetische Deep-Research-Aufgaben und gewünschte Trajektorien mithilfe eines stärkeren Modells (Destillation)
SFT-Phase — Supervised Fine-Tuning auf synthetischen Daten
Agentenspezifische RL-Phase — separates Reinforcement Learning für jeden der drei Agenten
Integrationsphase — Fine-Tuning auf kombinierten Aufgaben, bei denen alle drei Agenten zusammenarbeiten

Der Ansatz ist im Post-Training-Bereich üblich, aber die Kombination aus Data Synthesis + agentenspezifischem RL + mehrstufiger Integration ist laut den Autoren konkret und reproduzierbar.

Warum ist das wichtig?

Zwei Gründe:

1. Demokratisierung des Zugangs. 30B-Modelle können auf Hardware im Wert von einigen tausend Euro selbst gehostet werden. GPT-4-Klasse erfordert API-Aufrufe oder massive GPU-Cluster. Wenn MindDR wirklich mit OpenAI Deep Research konkurriert, öffnet sich die Tür für On-Premise Deep Research für Branchen mit Datenschutzanforderungen (Rechts-, Finanz-, Medizinbereich).

2. Architektur vs. Skala. Der Mythos „größeres Modell = besseres Ergebnis” bekommt ein Gegenbeispiel. Spezialisierung durch Multi-Agenten-Design kann Skalennachteile kompensieren — nicht vollständig, aber ausreichend für praktische Aufgaben.

Was muss verifiziert werden?

Wie bei allen technischen Berichten ist eine unabhängige Überprüfung notwendig:

Reproduzierbarkeit — ist der Code verfügbar und sind die Ergebnisse wiederholbar?
Benchmark-Abdeckung — welche Deep-Research-Aufgaben wurden genau getestet? Die Autoren verwenden BrowseComp und ähnliche, aber die Abdeckung variiert
Robustheit — was passiert, wenn eine Webquelle hinter einer Paywall liegt? Was bei widersprüchlichen Quellen?

Aktuell ist MindDR ein vielversprechendes Signal, dass Deep Research zugänglicher werden kann — aber Zeit und die Gemeinschaft sind nötig, um zu beurteilen, wie gut es tatsächlich in der Praxis funktioniert.

Mind DeepResearch: ein Drei-Agenten-Framework erzielt Top-Ergebnisse bei Deep-Research-Aufgaben mit 30B-Modellen statt GPT-4-Skala

Was bringt Mind DeepResearch?

Drei-Agenten-Architektur

Vierstufige Trainings-Pipeline

Warum ist das wichtig?

Was muss verifiziert werden?

Quellen

Verwandte Nachrichten