🤖 24 AI
🟡 🤖 Modeli petak, 24. travnja 2026. · 3 min čitanja

Thinking with Reasoning Skills (ACL 2026 Industry Track): manje tokena, veća točnost kroz dohvat skilsova zaključivanja

Editorial illustration: reasoning skills — obrasci zaključivanja i tokeni

Zašto je bitno

Tim autora Zhao i suradnika objavio je na ACL 2026 Industry Tracku rad koji predlaže destilaciju reusable reasoning skilsova iz ekstenzivnog istraživanja. Umjesto razmišljanja od nule, model dohvaća relevantne obrasce, što smanjuje broj reasoning tokena i povećava točnost na kodiranju i matematici.

Na ArXivu je 24. travnja 2026. objavljen rad “Thinking with Reasoning Skills: Fewer Tokens, More Accuracy”, prihvaćen za 64. godišnji skup Association for Computational Linguistics (ACL 2026), Industry Track. Autori su Guangxiang Zhao, Qilong Shi, Xusen Xiao, Xiangzheng Zhang, Tong Yang i Lin Sun.

Rad adresira jedan od najboljih poznatih problema moderne generacije reasoning modela: veliku potrošnju tokena na generiranje lanaca razmišljanja (chain-of-thought), koja izravno utječe na latenciju i cijenu inference poziva u produkciji.

Što autori predlažu?

Umjesto tradicionalne paradigme u kojoj reasoning model svaki put generira lanac razmišljanja od nule, autori predlažu da model dohvaća ponovno upotrebljive obrasce zaključivanja — “reasoning skills” — iz unaprijed izgrađene baze.

Te skillsovi destiliraju se kroz ekstenzivno istraživanje nad težim zadacima: model generira mnogo tragova razmišljanja, zatim se iz njih apstrahiraju strukturirani obrasci koji funkcioniraju kao “predlošci zaključivanja”. Pri inferenciji nad novim problemom, sustav identificira relevantan skill i koristi ga kao polaznu točku.

Rezultat je dvostruka prednost — smanjenje potrošnje tokena (jer model ne mora graditi punu logičku strukturu iz početka) i povećanje točnosti (jer se koriste obrasci koji su se već pokazali uspješnima).

Kako se to razlikuje od RAG-a ili in-context learninga?

Na prvi pogled pristup sliči retrieval-augmented generation (RAG) metodi, ali razlika je ključna: RAG dohvaća činjenice ili dokumente, dok se ovdje dohvaća apstraktni strukturirani obrazac razmišljanja.

Također se razlikuje od in-context learninga s few-shot primjerima. Few-shot prompting daje modelu konkretne primjere riješenih zadataka, dok reasoning skills predstavljaju generalizirane mete — način na koji se određena klasa problema pristupa, bez konkretnih brojki ili ulaznih vrijednosti.

Autori tvrde da je to bliže onome kako ljudski stručnjak rješava poznate tipove problema: ne ponavlja razmišljanje od nule, već prepoznaje obrazac i aplicira provjerenu strukturu rješenja.

Na kojim je zadacima metoda evaluirana?

Rad se fokusira na kodiranje i matematičko zaključivanje, dva domena u kojima se reasoning modeli danas najčešće koriste u produkciji. Autori pokazuju da dohvaćanje skillsova nadmašuje konvencionalno razmišljanje od nule u oba aspekta — broju utrošenih tokena i točnosti konačnog odgovora.

Konkretni numerički rezultati dostupni su u punom tekstu rada, ali ključna tvrdnja je kvalitativna: metoda pomiče Pareto frontier efikasnosti, omogućujući modelima da budu istovremeno jeftiniji i točniji.

Zašto je ovo bitno za hrvatske razvojne timove?

Reasoning modeli poput OpenAI GPT-5.5, Anthropic Opus 4.7 i DeepSeek V4 objavljenog istog dana imaju tipično 3 do 10 puta veću potrošnju tokena od ne-reasoning modela. To direktno utječe na operativne troškove chatbota, copilot alata i agentskih sustava.

Pristup koji istovremeno smanjuje token count i povećava točnost je rijedak u literaturi — većina optimizacija trguje jedno za drugo. Ako se rezultati reproduciraju u nezavisnim eksperimentima, očekivati je integraciju u sljedeće generacije produkcijskih reasoning modela, vjerojatno kroz slojevite agentske frameworkove.

Za timove koji grade AI copilot alate za hrvatske poslovne korisnike, gdje je svaki poziv reasoning modela skup, ovakve tehnike su potencijalno prijelomne. Industry Track na ACL-u potvrđuje da rad ima direktnu industrijsku primjenu, a ne samo akademsku vrijednost.

🤖

Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.