Što TREX automatizira?

Kompletan lifecycle fine-tuninga LLM-ova: analizu zahtjeva, pretraživanje literature i podataka, formuliranje strategija treniranja, pripremu podataka i evaluaciju rezultata.

Kako TREX koristi stablo pretraživanja?

Modelira eksperimentalni proces kao stablo pretraživanja gdje svaki čvor predstavlja konfiguraciju treniranja, omogućujući efikasno planiranje, ponovnu upotrebu prethodnih rezultata i izvlačenje zaključaka iz iterativnih pokusa.

ArXiv: TREX — dva AI agenta automatiziraju cijeli proces fine-tuninga jezičnih modela

Problem: fine-tuning zahtijeva previše ljudskog rada

Fine-tuning (fino podešavanje) velikih jezičnih modela — proces prilagodbe pretreniranog modela specifičnom zadatku — trenutno zahtijeva značajnu ljudsku ekspertizu. Istraživač mora analizirati zahtjeve, pretražiti relevantnu literaturu, pripremiti podatke, odabrati hiperparametre, provesti eksperimente i evaluirati rezultate. Svaki od tih koraka uključuje niz odluka koje se oslanjaju na iskustvo i intuiciju.

Istraživači Zerun Ma, Guoqiang Wang i Xinchen Xie predlažu TREX — sustav koji automatizira cijeli taj process koristeći dva koordinirana AI agenta.

Kako TREX radi?

Sustav se temelji na dva modula. Researcher (istraživač) preuzima zadatke analize zahtjeva, pretraživanja literature i podatkovnih izvora te formuliranja strategija treniranja. Executor (izvršitelj) implementira konkretne eksperimente — od pripreme podatkovnih recepata do pokretanja treniranja i evaluacije rezultata.

Ključna inovacija je modeliranje eksperimentalnog procesa kao stabla pretraživanja (engl. search tree). Svaki čvor u stablu predstavlja specifičnu konfiguraciju treniranja, a grane vode prema varijacijama. Sustav može efikasno planirati putove istraživanja, ponovno koristiti rezultate prethodnih eksperimenata i izvlačiti zaključke iz iterativnih pokušaja — umjesto da svaki eksperiment kreće od nule.

Rezultati na FT-Bench benchmarku

Za evaluaciju, istraživači su razvili FT-Bench — benchmark s 10 stvarnih zadataka koji pokrivaju raspon od optimizacije temeljnih sposobnosti do poboljšanja domenski specifičnih performansi. Rezultati pokazuju da TREX agent “konzistentno optimizira performanse modela na ciljnim zadacima”.

Za timove koji redovito fine-tuniraju modele, TREX obećava značajno smanjenje vremena i troškova eksperimentiranja — automatizacijom rutinskih koraka koje trenutno rade skupi ML inženjeri.

ArXiv: TREX — dva AI agenta automatiziraju cijeli proces fine-tuninga jezičnih modela

Problem: fine-tuning zahtijeva previše ljudskog rada

Kako TREX radi?

Rezultati na FT-Bench benchmarku

Izvori

Povezane vijesti