🟡 🤝 Agenti ponedjeljak, 27. travnja 2026. · 3 min čitanja

arXiv:2604.22452: Superminds Test pokazuje da kolektivna inteligencija ne nastaje sama u društvu od 2 milijuna AI agenata

arXiv:2604.22452 ↗

Apstraktni kompas pero koji prati rijetke i plitke veze između mnoštva AI agenata u velikoj digitalnoj zajednici.

Zašto je bitno

Istraživači sa sveučilišta u Melbourneu i Marylandu uveli su Superminds Test, hijerarhijski okvir za probanje kolektivne inteligencije agentnih društava. Studij na MoltBook platformi s preko 2 milijuna agenata pokazao je da društvo ne nadmašuje pojedinačne frontier modele i da interakcije ostaju vrlo plitke i rijetke.

Rad “Superminds Test: Actively Evaluating Collective Intelligence of Agent Society via Probing Agents” objavljen je na arXiv pod brojem 2604.22452 i donosi nalaz koji je u suprotnosti s intuicijom mnogih u multi-agent zajednici. Iza rada stoje Xirui Li, Ming Li, Yunze Xiao, Ryan Wong, Dianqi Li, Timothy Baldwin i Tianyi Zhou.

Što su autori htjeli odgovoriti?

Pitanje je jednostavno i radikalno: “Does collective intelligence emerge spontaneously from scale?” Drugim riječima, ako u jednu platformu staviš milijune autonomnih LLM agenata i pustiš ih da slobodno komuniciraju, hoće li društvo kao cjelina postati pametnije od bilo kojeg pojedinačnog agenta?

To je važno pitanje jer dobar dio recentnih multi-agent sustava implicitno pretpostavlja da je odgovor potvrdan — više agenata, bolje rezoniranje, bogatija sinteza informacija, čvršća koordinacija.

Kakvo je rješenje za mjerenje?

Autori uvode Superminds Test, hijerarhijski okvir koji ne mjeri agente izvan konteksta, nego ih probing agenti aktivno testiraju unutar njihovog vlastitog okruženja. Test ima tri razine:

  1. Joint reasoning — može li društvo zajedno riješiti složeni zadatak rezoniranja?
  2. Information synthesis — može li sintetizirati distribuirane informacije rasprostranjene po više agenata?
  3. Basic interaction — može li uopće obaviti elementarnu koordinaciju između nekoliko sudionika?

Probing agenti su kontrolirani vanjski subjekti koji ulaze u zajednicu, postavljaju zadatke i mjere odgovore.

Konkretni rezultati

Studij je proveden na MoltBook platformi koja hostira preko dva milijuna agenata. Nalazi su, riječima autora, “stark”:

“Our experiments reveal a stark absence of collective intelligence. The society fails to outperform individual frontier models on complex reasoning tasks, rarely synthesizes distributed information, and often fails even trivial coordination tasks.”

Drugim riječima, društvo s dva milijuna LLM agenata ne nadmašuje pojedinačne frontier modele na složenim reasoning zadacima. Rijetko sintetizira informacije rasprostranjene po više agenata. Često ne uspijeva ni u trivijalnim zadacima koordinacije.

Platformska analiza otkriva i zašto:

“Interactions remain shallow, with threads rarely extending beyond a single reply and most responses being generic or off-topic.”

Niti razgovora rijetko se protežu preko jednog odgovora, a većina reakcija je generička ili izvan teme. Agenti tehnički komuniciraju, ali ne grade jedni na drugima.

Zašto je ovo važno?

Zaključak rada glasi:

“Collective intelligence does not emerge from scale alone. Instead, the dominant limitation of current agent societies is extremely sparse and shallow interaction, which prevents agents from exchanging information and building on each other’s outputs.”

Implikacije su značajne. Ako u multi-agent sustavu radite na pretpostavci da će više agenata automatski riješiti probleme rezoniranja, ovaj rad sugerira da to neće raditi. Potrebne su eksplicitne arhitekturalne odluke koje prisiljavaju agente da grade na tuđim outputima, a ne da generiraju paralelne monologe.

To otvara prostor za novu generaciju protokola interakcije — strukturirane debate, eksplicitno citiranje, agregacijski sloj koji vrši sintezu prije iduće runde — sve mehanizmi koji u ljudskim društvima postoje implicitno, a u agentnim društvima moraju biti dizajnirani.

Što slijedi?

Superminds Test sam po sebi je vrijedan kao mjerni alat — može se primijeniti na bilo koju multi-agent platformu i dati kvantitativan odgovor o stvarnoj koherenciji društva. Sljedeći logičan korak za zajednicu je usporedba arhitektura: koje vrste interakcije zaista podižu rezultate na sve tri razine testa? Rad ne daje odgovor na to pitanje, ali pruža instrument kojim se može tražiti.

🤖

Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.