🤖 24 AI
🟢 🤝 Agenti četvrtak, 16. travnja 2026. · 2 min čitanja

ArXiv: TREX — dva AI agenta automatiziraju cijeli proces fine-tuninga jezičnih modela

Zašto je bitno

TREX je novi višeagentni sustav koji automatizira kompletan pipeline fine-tuninga velikih jezičnih modela — od analize zahtjeva i pretraživanja literature do pripreme podataka i evaluacije rezultata. Sustav modelira eksperimentalni proces kao stablo pretraživanja, a na FT-Bench benchmarku s 10 stvarnih zadataka konzistentno optimizira performanse modela.

Problem: fine-tuning zahtijeva previše ljudskog rada

Fine-tuning (fino podešavanje) velikih jezičnih modela — proces prilagodbe pretreniranog modela specifičnom zadatku — trenutno zahtijeva značajnu ljudsku ekspertizu. Istraživač mora analizirati zahtjeve, pretražiti relevantnu literaturu, pripremiti podatke, odabrati hiperparametre, provesti eksperimente i evaluirati rezultate. Svaki od tih koraka uključuje niz odluka koje se oslanjaju na iskustvo i intuiciju.

Istraživači Zerun Ma, Guoqiang Wang i Xinchen Xie predlažu TREX — sustav koji automatizira cijeli taj process koristeći dva koordinirana AI agenta.

Kako TREX radi?

Sustav se temelji na dva modula. Researcher (istraživač) preuzima zadatke analize zahtjeva, pretraživanja literature i podatkovnih izvora te formuliranja strategija treniranja. Executor (izvršitelj) implementira konkretne eksperimente — od pripreme podatkovnih recepata do pokretanja treniranja i evaluacije rezultata.

Ključna inovacija je modeliranje eksperimentalnog procesa kao stabla pretraživanja (engl. search tree). Svaki čvor u stablu predstavlja specifičnu konfiguraciju treniranja, a grane vode prema varijacijama. Sustav može efikasno planirati putove istraživanja, ponovno koristiti rezultate prethodnih eksperimenata i izvlačiti zaključke iz iterativnih pokušaja — umjesto da svaki eksperiment kreće od nule.

Rezultati na FT-Bench benchmarku

Za evaluaciju, istraživači su razvili FT-Bench — benchmark s 10 stvarnih zadataka koji pokrivaju raspon od optimizacije temeljnih sposobnosti do poboljšanja domenski specifičnih performansi. Rezultati pokazuju da TREX agent “konzistentno optimizira performanse modela na ciljnim zadacima”.

Za timove koji redovito fine-tuniraju modele, TREX obećava značajno smanjenje vremena i troškova eksperimentiranja — automatizacijom rutinskih koraka koje trenutno rade skupi ML inženjeri.

🤖

Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.