SoftSkill: skill u 32 tokena, +42,1 na LiveMath

SoftSkill je metoda opisana u radu arXiv:2606.20333 koja pretvara skill-dokumente, poput Markdown SKILL.md datoteka, u kompaktne kontinuirane latentne objekte koji vode ponašanje modela bez mijenjanja baznog modela. Umjesto stotina ili tisuća tokena uputa, SoftSkill koristi 32 virtualna tokena i na zadatku LiveMath postiže poboljšanje od 42,1 postotnog boda u odnosu na rad bez vještine.

Rad arXiv:2606.20333 predstavlja SoftSkill, metodu koja skill-dokumente pretvara u kompaktne latentne kontrolne objekte. Skill-dokument je tekstualna uputa, primjerice Markdown datoteka SKILL.md, koja modelu opisuje kako obaviti određeni zadatak. Takve upute znaju zauzeti stotine ili tisuće tokena konteksta, što troši prozor i usporava izvođenje.

Kako radi behavioral compression

SoftSkill primjenjuje bihevioralnu kompresiju — uputu iz prirodnog jezika sažima u 32 virtualna (latentna) tokena koji usmjeravaju ponašanje modela, a da pritom ne mijenjaju težine baznog modela. Za razliku od fine-tuninga, koji prilagođava sam model, SoftSkill djeluje samo kroz dodane kontrolne tokene, pa se vještine mogu uključivati i isključivati po potrebi bez ponovnog treniranja.

Rezultati u brojkama

Na zadatku LiveMath SoftSkill donosi +42,1 postotnog boda u odnosu na rad bez vještine i +12,5 boda u odnosu na konkurentske metode. Na SearchQA postiže +8,3 boda nad osnovnim promptingom i +5,2 boda nad metodom SkillOpt. Usporedba pokazuje da sažeti latentni prikaz ne samo da štedi tokene, nego i nadmašuje izvorne tekstualne upute po točnosti.

Što to mijenja

Manji broj tokena znači niži trošak i brže izvođenje, posebno kod agenata koji žongliraju s više vještina istovremeno. Budući da bazni model ostaje netaknut, SoftSkill je kompatibilan s postojećim modelima i nudi praktičan put za modularno dodavanje sposobnosti. Pristup se uklapa u širi trend zamjene dugačkih sistemskih uputa kompaktnim, naučenim kontrolnim signalima.

Česta pitanja

Što SoftSkill radi?

SoftSkill pretvara skill-dokumente u 32 kontinuirana latentna tokena koji usmjeravaju ponašanje modela bez izmjene njegovih težina.

Koliko poboljšava rezultate?

Na zadatku LiveMath SoftSkill donosi +42,1 postotnog boda u odnosu na prompting bez vještine i +12,5 boda u odnosu na konkurentske metode, a na SearchQA +8,3 boda nad baseline promptingom.

Mijenja li se bazni model?

Ne, bazni model ostaje nepromijenjen; SoftSkill djeluje samo kroz latentne kontrolne tokene.

arXiv:2606.20333: SoftSkill komprimira skill-dokumente u 32 latentna tokena i diže LiveMath za 42,1 boda

Kako radi behavioral compression

Rezultati u brojkama

Što to mijenja

Česta pitanja

Izvori

Povezane vijesti