Kako AC/DC framework istovremeno evoluira modele i zadatke?

Kroz principe open-endedness — modeli se nastaju kroz merging različitih težina, a zadaci se generiraju kao sintetički podaci koji guraju modele u nove niše. Oba procesa su povezana kroz jedan run, bez manualnih intervencija.

Zašto modeli ne optimiziraju za benchmarke ali ih nadmašuju?

Umjesto da se treniraju protiv fiksnih benchmarka, modeli se natječu međusobno na sintetičkim zadacima. Rezultat je populacija eksperata koja prirodno pokriva širi prostor sposobnosti, a pojedine niše ispadnu jake na standardnim testovima bez izravnog ciljanja.

ArXiv AC/DC: automatsko otkrivanje specijaliziranih LLM-ova kroz koevoluciju modela i zadataka

Tim autora Andrew Dai, Boris Meinardus, Ciaran Regan, Yingtao Tian i Yujin Tang objavio je novi framework AC/DC pod punim nazivom “Discovering Novel LLM Experts via Task-Capability Coevolution”. Paper je prihvaćen na ICLR 2026 konferenciju i predstavlja novi način razvoja LLM-ova koji potpuno napušta klasičan pristup odvojenim trening rundama.

Problem koji rješava

Tradicionalno, kada tim želi proširiti sposobnosti LLM-a, mora pokrenuti novu odvojenu trening rundu za svaku novu domenu. Želiš medicinski ekspert? Odvojen run. Pravni model? Još jedan. Financijski? Treći. Svaki zahtijeva hyperparametre, podatke, evaluaciju, regresijske testove.

AC/DC eliminira tu manualnu skupinu intervencija. Autori tvrde da “open-endedness — kroz koevoluciju modela i zadataka — može otkriti modele s sve noviljim sposobnostima u jednom runu”.

Kako framework radi

AC/DC istovremeno evoluira dva komponenta:

Modeli — kroz model merging tehnike. Umjesto treniranja pojedinog modela from scratch, više postojećih modela se spajaju (kroz razne težinske kombinacije) i rezultirajuća populacija se testira.

Zadaci — kroz sintetičku generaciju podataka. Svaki task sam evoluira — generira se novi, složeniji, nyanser varijacije starih taskova, i cijela populacija zadataka guraja modele u nove niše.

Ključ je da su dva procesa povezana. Modeli se natječu na sintetičkim zadacima. Zadaci se prilagođavaju tako da neki modeli uspiju tamo gdje drugi padnu. I tako unedogled — bez manualne intervencije.

Rezultati

Autori navode nekoliko značajnih nalaza:

Otkrivene populacije demonstriraju širu pokrivenost ekspertize od ručno kuriranih modela
Modeli nadmašuju veće pandane uz manju GPU memoriju
Pokazana kontinuirana inovacija i u task dizajnu i u sposobnostima modela
Poboljšana performansa u multi-agent best-of-N selection scenarijima

Važno je primijetiti što nije u rezultatima — nema tvrdnji o dominaciji na konkretnim benchmarcima. Autori eksplicitno ne ciljaju SOTA. Umjesto toga, pokazuju da populacija AC/DC modela ima bogatiju funkcionalnu raznolikost.

Nova paradigma razvoja

Autori AC/DC pozicioniraju kao “profoundly new paradigm of LLM development”. Umjesto ciklusa:

Identificiraj use case
Kuriraj podatke
Pokreni trening
Evaluiraj
Iteriraj

Imaš:

Pokreni framework
Pusti ga da otkriva niše sam

To je smjelo postavljanje. Ostaje pitanje koliko je u praksi robusno za enterprise — open-endedness zvuči romantično, ali produkcijski timovi obično trebaju predvidivost.

Kontekst ICLR 2026

AC/DC je jedan od više 2026 radova iz istog sustvata — istraživanje o automatskom otkrivanju AI sposobnosti kroz evoluciju. Povezana linija rada je s ranijim “Novelty Search” pristupima iz evolutornog računanja, adaptiranim za AI.

Autori ne navode konkretne kompanije ili enterprise deployment, što je signal da je ovo primarno istraživački rad u pre-produkcijskoj fazi. Ipak, framework je fascinantan jer otvara put prema AI sustavima koji sami istražuju prostor mogućih ekspertiza — bez toga da inženjeri moraju unaprijed definirati što žele dobiti.

Za one koji prate dugoročne trendove AI razvoja, AC/DC je značajan podatak. Za trenutne produkcijske sustave — gotovo sigurno nije direktno primjenjiv, ali predstavlja smjer u kojem se polje može pomicati kroz sljedeće nekoliko godina.