Što je deep research agent?

Deep research agent je AI sustav koji samostalno obavlja složene, dugoročne istraživačke zadatke — pretražuje web, čita izvore, sintetizira informacije i piše izvještaj u stil analitičara, u trajanju od minuta do sati.

Zašto je 30B skala važna?

Deep research je dosad dominirao GPT-4/Claude Opus klasom (stotine milijardi parametara). 30B modeli su 10× jeftiniji za inference i mogu se self-hostati. Ako arhitektura kompenzira skalu, demokratizira se pristup.

Mind DeepResearch: top rezultati s 30B modelima

Što Mind DeepResearch donosi?

Mind DeepResearch (MindDR) je novi multi-agent sustav predstavljen kao tehnički izvještaj na arXivu 17. travnja 2026. Fokusiran je na jednu od najzahtjevnijih AI kategorija — deep research — i tvrdi da može postići top rezultate bez potrebe za frontier modelima tipa GPT-4 ili Claude Opus.

Deep research je zadatak u kojem AI sustav samostalno obavlja složen istraživački projekt: pretražuje web, čita izvore, sintetizira različite perspektive, evaluira pouzdanost, i producira izvještaj na razini analitičara. OpenAI Deep Research, Perplexity Deep Research, Gemini Deep Research — svi se oslanjaju na modele stotine milijardi parametara.

MindDR radi s ~30 milijardi parametara — klasa Qwen2.5-32B ili DeepSeek V3-small — 10 puta jeftinijom infrastrukturom.

Tri-agentna arhitektura

Rad opisuje specijalizaciju kroz tri agenta:

Planning Agent — na ulazu od korisničkog upita, razlaže zadatak u konkretne istraživačke pod-ciljeve. Postavlja pitanje: “Što točno moram saznati i kojim redoslijedom?”
DeepSearch Agent — obavlja stvarno istraživanje. Postavlja pretrage, čita izvore, vadi činjenice, kritički evaluira. Ovo je “runner” koji hoda kroz web.
Report Agent — sinteza. Iz prikupljenih informacija piše konačan izvještaj u strukturiranom formatu, citira izvore, balansira perspektive.

Svaki agent je specijaliziran za svoj dio posla — za razliku od monolitnih pristupa gdje jedan model radi sve istovremeno.

Četverostupanjski training pipeline

Bez skale, kompenzacija mora doći od podataka i treninga. MindDR koristi:

Data synthesis stage — generira sintetičke deep research zadatke i željene trajektorije pomoću jačeg modela (destilacija)
SFT stage — supervised fine-tuning na sintetičkim podacima
Agent-specific RL stage — separate reinforcement learning za svaki od tri agenta
Integration stage — fine-tuning na kombiniranim task-ovima gdje tri agenta zajedno rade

Pristup je uobičajen u post-training prostoru, ali kombinacija data synthesis + agent-specific RL + multi-stage integration je konkretna i reproducibilna prema autorima.

Zašto je to važno?

Dva razloga:

1. Demokratizacija pristupa. 30B modeli se mogu self-host-ati na hardveru vrijednom nekoliko tisuća eura. GPT-4 klasa zahtijeva API pozive ili masivne GPU klastere. Ako MindDR stvarno konkurira OpenAI Deep Research-u, otvara se vrata on-premise deep research za industrije s data privacy zahtjevima (pravni, financijski, medicinski sektor).

2. Arhitektura vs. skala. Mit “veći model = bolji rezultat” dobija protu-primjer. Specijalizacija kroz multi-agent dizajn može kompenzirati skalu — ne potpuno, ali dovoljno za praktične zadatke.

Što treba verificirati?

Kao i svi tehnički izvještaji, potrebna je neovisna verifikacija:

Reproduciranje — je li code dostupan i rezultati ponovljivi?
Benchmark pokrivenost — koji točno deep research zadaci su testirani? Autori koriste BrowseComp i slične, ali pokrivenost varira
Robusnost — što kad je web izvor neregistriran? Što kod neslaganja između izvora?

Za now, MindDR je obećavajući signal da deep research može postati dostupniji — ali treba vrijeme i zajednica da procijeni koliko dobro zapravo radi u divljini.

Mind DeepResearch: tri-agentni framework postiže top rezultate u deep research zadacima s 30B modelima umjesto GPT-4 skale

Što Mind DeepResearch donosi?

Tri-agentna arhitektura

Četverostupanjski training pipeline

Zašto je to važno?

Što treba verificirati?

Izvori

Povezane vijesti