🤖 24 AI
🟢 🤝 Agenti nedjelja, 19. travnja 2026. · 3 min čitanja

Mind DeepResearch: tri-agentni framework postiže top rezultate u deep research zadacima s 30B modelima umjesto GPT-4 skale

Editorial ilustracija: tri apstraktna agenta koji surađuju u istraživačkom procesu, mrežna struktura

Zašto je bitno

Mind DeepResearch (MindDR) je novi multi-agent framework za deep research koji postiže kompetitivne rezultate s modelima od oko 30 milijardi parametara — veličinom Qwen2.5 ili DeepSeek razreda, a ne GPT-4 ili Claude Opus. Arhitektura: Planning Agent + DeepSearch Agent + Report Agent uz četverostupanjski training pipeline s data synthesis, prema tehničkom izvještaju objavljenom 17. travnja 2026.

Što Mind DeepResearch donosi?

Mind DeepResearch (MindDR) je novi multi-agent sustav predstavljen kao tehnički izvještaj na arXivu 17. travnja 2026. Fokusiran je na jednu od najzahtjevnijih AI kategorija — deep research — i tvrdi da može postići top rezultate bez potrebe za frontier modelima tipa GPT-4 ili Claude Opus.

Deep research je zadatak u kojem AI sustav samostalno obavlja složen istraživački projekt: pretražuje web, čita izvore, sintetizira različite perspektive, evaluira pouzdanost, i producira izvještaj na razini analitičara. OpenAI Deep Research, Perplexity Deep Research, Gemini Deep Research — svi se oslanjaju na modele stotine milijardi parametara.

MindDR radi s ~30 milijardi parametara — klasa Qwen2.5-32B ili DeepSeek V3-small — 10 puta jeftinijom infrastrukturom.

Tri-agentna arhitektura

Rad opisuje specijalizaciju kroz tri agenta:

  1. Planning Agent — na ulazu od korisničkog upita, razlaže zadatak u konkretne istraživačke pod-ciljeve. Postavlja pitanje: “Što točno moram saznati i kojim redoslijedom?”

  2. DeepSearch Agent — obavlja stvarno istraživanje. Postavlja pretrage, čita izvore, vadi činjenice, kritički evaluira. Ovo je “runner” koji hoda kroz web.

  3. Report Agent — sinteza. Iz prikupljenih informacija piše konačan izvještaj u strukturiranom formatu, citira izvore, balansira perspektive.

Svaki agent je specijaliziran za svoj dio posla — za razliku od monolitnih pristupa gdje jedan model radi sve istovremeno.

Četverostupanjski training pipeline

Bez skale, kompenzacija mora doći od podataka i treninga. MindDR koristi:

  1. Data synthesis stage — generira sintetičke deep research zadatke i željene trajektorije pomoću jačeg modela (destilacija)
  2. SFT stage — supervised fine-tuning na sintetičkim podacima
  3. Agent-specific RL stage — separate reinforcement learning za svaki od tri agenta
  4. Integration stage — fine-tuning na kombiniranim task-ovima gdje tri agenta zajedno rade

Pristup je uobičajen u post-training prostoru, ali kombinacija data synthesis + agent-specific RL + multi-stage integration je konkretna i reproducibilna prema autorima.

Zašto je to važno?

Dva razloga:

1. Demokratizacija pristupa. 30B modeli se mogu self-host-ati na hardveru vrijednom nekoliko tisuća eura. GPT-4 klasa zahtijeva API pozive ili masivne GPU klastere. Ako MindDR stvarno konkurira OpenAI Deep Research-u, otvara se vrata on-premise deep research za industrije s data privacy zahtjevima (pravni, financijski, medicinski sektor).

2. Arhitektura vs. skala. Mit “veći model = bolji rezultat” dobija protu-primjer. Specijalizacija kroz multi-agent dizajn može kompenzirati skalu — ne potpuno, ali dovoljno za praktične zadatke.

Što treba verificirati?

Kao i svi tehnički izvještaji, potrebna je neovisna verifikacija:

  • Reproduciranje — je li code dostupan i rezultati ponovljivi?
  • Benchmark pokrivenost — koji točno deep research zadaci su testirani? Autori koriste BrowseComp i slične, ali pokrivenost varira
  • Robusnost — što kad je web izvor neregistriran? Što kod neslaganja između izvora?

Za now, MindDR je obećavajući signal da deep research može postati dostupniji — ali treba vrijeme i zajednica da procijeni koliko dobro zapravo radi u divljini.

🤖

Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.