ArXiv: CoT transformeri zarobljeni u TC^0 — signposti rješenje

Novi ArXiv preprint Krausa, Sarrofa, Yaa, Kollera i Hahna pokazuje da standardni transformeri s Chain-of-Thought reasoningom ne mogu rješavati probleme izvan TC^0 kompleksnosti pod stroženom zahtjevom length-generalizable učenja. Empirijski uspjeh CoT-a ne implicira teorijsku Turing kompletnost u praksi. Predloženo rješenje — dinamičko proširenje vokabulara plus signpost tokeni — omogućuje length-generalizable simulaciju Turing strojeva s linearnim CoT overheadom.

Tim Krausa, Sarrofa, Yaa, Kollera i Hahna objavio je 28. travnja 2026. preprint Barriers to Universal Reasoning With Transformers (And How to Overcome Them) — teorijski rad koji ima izravne implikacije za skaliranje Chain-of-Thought reasoninga u current-gen LLM-ovima.

Što je dokazano?

Glavna teza preprinta: iako je u literaturi poznato da CoT teorijski povećava ekspresivnost transformera do Turing kompletnosti, ta tvrdnja ne vrijedi pod stroženim zahtjevom length-generalizable učenja (sposobnost rješavanja CoT traceova duljih od onih viđenih u treningu).

Citat iz abstracta:

“Pod standardnim positional encodings i konačnim alfabetom — transformeri s CoT-om ne mogu rješavati probleme izvan TC^0, tj. ekspresivnost benefits ne vrijede pod stroženom zahtjevu length-generalizable learnability.”

Praktična implikacija: mnogi reasoning problemi koji izgledaju kao da se rješavaju na trening dužinama, padaju kad se sequence length poveća. To objašnjava zašto LLM-ovi često “zaborave brojati” ili gube točnost na dugim aritmetičkim/logičkim lancima.

Predložena rješenja

Autori predlažu dva komplementarna mehanizma:

1. Dinamičko skaliranje vokabulara

Vokabular raste s veličinom problema. Time se izbjegava ograničenje “konačnog alfabeta” iz teorema.

2. Signpost tokeni + value-change encoding

Signpost tokeni — jedinstveni identifikatori dodijeljeni svakoj poziciji “trake” simulacijskog stroja
Value-change encoding — logiranje samo promjena stanja umjesto kompletnih stanja, što omogućuje rekonstrukciju kroz brojanje

Kombinacija postiže glavni rezultat:

“Length-generalizable simulacija Turing strojeva gdje je CoT trace duljina linearna u simuliranom runtimeu uz konstantni faktor.”

Drugim riječima: ovaj pristup probija TC^0 barijeru uz minimalan token overhead.

Empirijska validacija

Osim teorijskog dokaza, autori prilažu empirijsku validaciju — signpost tokeni i value-change encodingi pokazuju “praktična poboljšanja u length generalization performansi na kompleksnim problemima.” Konkretni benchmarci nisu u dohvaćenom abstractu, ali punija analiza treba slijediti u puni paperu.

Zašto je to važno?

Ovaj rad pomaže objasniti zašto scaling reasoning samo dodavanjem više CoT tokena ne radi — postoji fundamentalna teorijska prepreka, ne samo training data deficit. Implikacije za sljedeću generaciju LLM-ova:

Arhitektura Anthropic Claude, OpenAI GPT i Gemini možda treba strukturalne dodatke za length generalization (signpost tokeni ili ekvivalent)
Multiplicirani CoT chain-of-tools pristupi (poput Mistral Vibe ili Anthropic Claude Code Sub-agents) možda već impliciraju nešto slično signpost mehanizmu

Rad treba pratiti zajedno s industry najavama — ako neka next-gen flagship model objava spomene “novi positional encoding” ili “dinamički vokabular”, to je vjerojatno odgovor na ovaj klasu teorijskog problema.

Česta pitanja

Što je TC^0 kompleksnost?

Klasa problema rješivih konstantnom dubinom paralelnih threshold krugova. Mnogi prirodno-jezični i logički problemi (parity, dvostruka aritmetika nad arbitrarno dugim ulazima) leže iznad TC^0. Standardni transformeri imaju ekspresivnost ograničenu na TC^0 pod fiksnim alfabetom i poziciono-encodingom.

Zašto Chain-of-Thought sam po sebi ne rješava problem?

Iako CoT teorijski povećava ekspresivnost transformera do Turing kompletnosti, autori dokazuju da pod *length-generalizable* uvjetom (sposobnost rješavanja CoT trace dužih od trening primjera) transformeri ne mogu rješavati probleme izvan TC^0. Praktični LLM-ovi propadaju na duljim sekvencama jer trening dužine drži ekspresivnost u TC^0.

Kako signpost tokeni rješavaju problem?

Signpost tokeni dodjeljuju jedinstvene identifikatore svakoj poziciji 'trake' simulacijskog stroja. Kombinirano s value-change encodingom (logiranje samo promjena umjesto kompletnih stanja), omogućuju length-generalizable simulaciju Turing strojeva gdje je CoT trace duljina linearna u runtime simulaciji uz konstantni faktor.

ArXiv: standardni transformeri s Chain-of-Thought ne mogu rezonirati izvan TC^0 kompleksnosti — signpost tokeni omogućuju length-generalizable Turing simulaciju