ArXiv AC/DC: automatsko otkrivanje specijaliziranih LLM-ova kroz koevoluciju modela i zadataka
Zašto je bitno
AC/DC je novi framework prezentiran na ICLR 2026 koji istovremeno evoluira LLM modele kroz model merging i zadatke kroz sintetičke podatke. Otkrivene populacije modela demonstriraju širu pokrivenost ekspertize od ručno kurirani modela bez eksplicitne optimizacije za benchmarke. Modeli nadmašuju veće pandane uz manju GPU memoriju, što predstavlja novi paradigm u kontinuiranom razvoju LLM-a.
Tim autora Andrew Dai, Boris Meinardus, Ciaran Regan, Yingtao Tian i Yujin Tang objavio je novi framework AC/DC pod punim nazivom “Discovering Novel LLM Experts via Task-Capability Coevolution”. Paper je prihvaćen na ICLR 2026 konferenciju i predstavlja novi način razvoja LLM-ova koji potpuno napušta klasičan pristup odvojenim trening rundama.
Problem koji rješava
Tradicionalno, kada tim želi proširiti sposobnosti LLM-a, mora pokrenuti novu odvojenu trening rundu za svaku novu domenu. Želiš medicinski ekspert? Odvojen run. Pravni model? Još jedan. Financijski? Treći. Svaki zahtijeva hyperparametre, podatke, evaluaciju, regresijske testove.
AC/DC eliminira tu manualnu skupinu intervencija. Autori tvrde da “open-endedness — kroz koevoluciju modela i zadataka — može otkriti modele s sve noviljim sposobnostima u jednom runu”.
Kako framework radi
AC/DC istovremeno evoluira dva komponenta:
Modeli — kroz model merging tehnike. Umjesto treniranja pojedinog modela from scratch, više postojećih modela se spajaju (kroz razne težinske kombinacije) i rezultirajuća populacija se testira.
Zadaci — kroz sintetičku generaciju podataka. Svaki task sam evoluira — generira se novi, složeniji, nyanser varijacije starih taskova, i cijela populacija zadataka guraja modele u nove niše.
Ključ je da su dva procesa povezana. Modeli se natječu na sintetičkim zadacima. Zadaci se prilagođavaju tako da neki modeli uspiju tamo gdje drugi padnu. I tako unedogled — bez manualne intervencije.
Rezultati
Autori navode nekoliko značajnih nalaza:
- Otkrivene populacije demonstriraju širu pokrivenost ekspertize od ručno kuriranih modela
- Modeli nadmašuju veće pandane uz manju GPU memoriju
- Pokazana kontinuirana inovacija i u task dizajnu i u sposobnostima modela
- Poboljšana performansa u multi-agent best-of-N selection scenarijima
Važno je primijetiti što nije u rezultatima — nema tvrdnji o dominaciji na konkretnim benchmarcima. Autori eksplicitno ne ciljaju SOTA. Umjesto toga, pokazuju da populacija AC/DC modela ima bogatiju funkcionalnu raznolikost.
Nova paradigma razvoja
Autori AC/DC pozicioniraju kao “profoundly new paradigm of LLM development”. Umjesto ciklusa:
- Identificiraj use case
- Kuriraj podatke
- Pokreni trening
- Evaluiraj
- Iteriraj
Imaš:
- Pokreni framework
- Pusti ga da otkriva niše sam
To je smjelo postavljanje. Ostaje pitanje koliko je u praksi robusno za enterprise — open-endedness zvuči romantično, ali produkcijski timovi obično trebaju predvidivost.
Kontekst ICLR 2026
AC/DC je jedan od više 2026 radova iz istog sustvata — istraživanje o automatskom otkrivanju AI sposobnosti kroz evoluciju. Povezana linija rada je s ranijim “Novelty Search” pristupima iz evolutornog računanja, adaptiranim za AI.
Autori ne navode konkretne kompanije ili enterprise deployment, što je signal da je ovo primarno istraživački rad u pre-produkcijskoj fazi. Ipak, framework je fascinantan jer otvara put prema AI sustavima koji sami istražuju prostor mogućih ekspertiza — bez toga da inženjeri moraju unaprijed definirati što žele dobiti.
Za one koji prate dugoročne trendove AI razvoja, AC/DC je značajan podatak. Za trenutne produkcijske sustave — gotovo sigurno nije direktno primjenjiv, ali predstavlja smjer u kojem se polje može pomicati kroz sljedeće nekoliko godina.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
Povezane vijesti
Thinking with Reasoning Skills (ACL 2026 Industry Track): manje tokena, veća točnost kroz dohvat skilsova zaključivanja
DeepSeek objavio V4-Pro i V4-Flash: dva open-source modela s milijun tokena konteksta i 80,6 na SWE Verified
OpenAI predstavio GPT-5.5: najpametniji model za kodiranje, istraživanje i složenu analizu podataka kroz alate