Mind DeepResearch: tri-agentni framework postiže top rezultate u deep research zadacima s 30B modelima umjesto GPT-4 skale
Mind DeepResearch (MindDR) je novi multi-agent framework za deep research koji postiže kompetitivne rezultate s modelima od oko 30 milijardi parametara — veličinom Qwen2.5 ili DeepSeek razreda, a ne GPT-4 ili Claude Opus. Arhitektura: Planning Agent + DeepSearch Agent + Report Agent uz četverostupanjski training pipeline s data synthesis, prema tehničkom izvještaju objavljenom 17. travnja 2026.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
Što Mind DeepResearch donosi?
Mind DeepResearch (MindDR) je novi multi-agent sustav predstavljen kao tehnički izvještaj na arXivu 17. travnja 2026. Fokusiran je na jednu od najzahtjevnijih AI kategorija — deep research — i tvrdi da može postići top rezultate bez potrebe za frontier modelima tipa GPT-4 ili Claude Opus.
Deep research je zadatak u kojem AI sustav samostalno obavlja složen istraživački projekt: pretražuje web, čita izvore, sintetizira različite perspektive, evaluira pouzdanost, i producira izvještaj na razini analitičara. OpenAI Deep Research, Perplexity Deep Research, Gemini Deep Research — svi se oslanjaju na modele stotine milijardi parametara.
MindDR radi s ~30 milijardi parametara — klasa Qwen2.5-32B ili DeepSeek V3-small — 10 puta jeftinijom infrastrukturom.
Tri-agentna arhitektura
Rad opisuje specijalizaciju kroz tri agenta:
-
Planning Agent — na ulazu od korisničkog upita, razlaže zadatak u konkretne istraživačke pod-ciljeve. Postavlja pitanje: “Što točno moram saznati i kojim redoslijedom?”
-
DeepSearch Agent — obavlja stvarno istraživanje. Postavlja pretrage, čita izvore, vadi činjenice, kritički evaluira. Ovo je “runner” koji hoda kroz web.
-
Report Agent — sinteza. Iz prikupljenih informacija piše konačan izvještaj u strukturiranom formatu, citira izvore, balansira perspektive.
Svaki agent je specijaliziran za svoj dio posla — za razliku od monolitnih pristupa gdje jedan model radi sve istovremeno.
Četverostupanjski training pipeline
Bez skale, kompenzacija mora doći od podataka i treninga. MindDR koristi:
- Data synthesis stage — generira sintetičke deep research zadatke i željene trajektorije pomoću jačeg modela (destilacija)
- SFT stage — supervised fine-tuning na sintetičkim podacima
- Agent-specific RL stage — separate reinforcement learning za svaki od tri agenta
- Integration stage — fine-tuning na kombiniranim task-ovima gdje tri agenta zajedno rade
Pristup je uobičajen u post-training prostoru, ali kombinacija data synthesis + agent-specific RL + multi-stage integration je konkretna i reproducibilna prema autorima.
Zašto je to važno?
Dva razloga:
1. Demokratizacija pristupa. 30B modeli se mogu self-host-ati na hardveru vrijednom nekoliko tisuća eura. GPT-4 klasa zahtijeva API pozive ili masivne GPU klastere. Ako MindDR stvarno konkurira OpenAI Deep Research-u, otvara se vrata on-premise deep research za industrije s data privacy zahtjevima (pravni, financijski, medicinski sektor).
2. Arhitektura vs. skala. Mit “veći model = bolji rezultat” dobija protu-primjer. Specijalizacija kroz multi-agent dizajn može kompenzirati skalu — ne potpuno, ali dovoljno za praktične zadatke.
Što treba verificirati?
Kao i svi tehnički izvještaji, potrebna je neovisna verifikacija:
- Reproduciranje — je li code dostupan i rezultati ponovljivi?
- Benchmark pokrivenost — koji točno deep research zadaci su testirani? Autori koriste BrowseComp i slične, ali pokrivenost varira
- Robusnost — što kad je web izvor neregistriran? Što kod neslaganja između izvora?
Za now, MindDR je obećavajući signal da deep research može postati dostupniji — ali treba vrijeme i zajednica da procijeni koliko dobro zapravo radi u divljini.
Česta pitanja
- Što je deep research agent?
- Deep research agent je AI sustav koji samostalno obavlja složene, dugoročne istraživačke zadatke — pretražuje web, čita izvore, sintetizira informacije i piše izvještaj u stil analitičara, u trajanju od minuta do sati.
- Zašto je 30B skala važna?
- Deep research je dosad dominirao GPT-4/Claude Opus klasom (stotine milijardi parametara). 30B modeli su 10× jeftiniji za inference i mogu se self-hostati. Ako arhitektura kompenzira skalu, demokratizira se pristup.
Povezane vijesti
arXiv:2605.22502: Kompiliranjem agentskih workflowa u LLM težine postiže se near-frontier kvaliteta uz 100 puta nižu cijenu
arXiv:2605.22794: MOSS pokazuje agente koji se sami unapređuju mijenjajući vlastiti izvorni kod
arXiv:2605.22535: TerminalWorld benchmark mjeri LLM agente na stvarnim Linux terminal zadacima bez simulacije