ArXiv: Algoritamska monokultura — LLM-ovi ne znaju divergirati kad bi trebali
Zašto je bitno
Novo istraživanje otkriva da jezični modeli u multi-agent koordinacijskim igrama pokazuju visoku baznu sličnost (monokultura) i teško održavaju raznolike strategije čak i kad bi divergencija bila korisna. To ima implikacije za sustave koji koriste više AI agenata.
Kad koristimo više AI agenata za rješavanje problema, pretpostavljamo da će donijeti raznolike perspektive. No novo istraživanje pokazuje da je ta pretpostavka pogrešna — jezični modeli pate od algoritamske monokulture, tendencije da svi razmišljaju i djeluju gotovo identično.
Eksperiment s koordinacijskim igrama
Istraživači su postavili LLM-ove u klasične koordinacijske igre iz teorije igara, gdje igrači moraju donositi strateške odluke. Ponekad je optimalna strategija koordinacija (svi rade isto), a ponekad divergencija (svaki radi nešto drugačije).
Rezultati su jasni: LLM-ovi pokazuju iznimno visoku baznu sličnost u donošenju odluka. Poput ljudi, prilagođavaju se kad dobiju poticaje — ali za razliku od ljudi, teško održavaju raznolike strategije kad bi divergencija bila korisnija.
Zašto je to problem
U stvarnom svijetu, multi-agent AI sustavi koriste se za sve, od financijskog trgovanja do upravljanja opskrbnim lancima. Ako svi agenti donose iste odluke na isti način, sustav gubi otpornost — jedan kvar ili pogrešna pretpostavka pogađa sve agente istovremeno.
Implikacije za dizajn sustava
Ovo istraživanje upozorava dizajnere multi-agent sustava da ne pretpostavljaju automatsku raznolikost samo zato što koriste više instanci modela. Potrebni su aktivni mehanizmi za poticanje divergencije — različiti promptovi, temperature, ili čak različiti modeli — kako bi se postigla stvarna otpornost sustava.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
Povezane vijesti
AISI testirao četiri Claude modela na sabotaži AI safety istraživanja: nema spontane sabotaže, ali Mythos Preview pokazao 65% nesklad između razmišljanja i postupaka
AISI 'Ask Don't Tell': preformulacija upita u pitanje smanjuje sycophancy LLM-ova za 24 postotna boda
ESRRSim okvir mjeri strateško zaključivanje u 11 reasoning modela: stope detekcije rizika variraju 14,45–72,72%, otkriva i međugeneracijsku evaluation awareness