LangChain RLM agenti: 79% bolje na 128k tokena od standardnih

LangChain je kroz DeepAgents okvir uveo Recursive Language Models (RLM) — pristup u kojem modeli pozivaju sami sebe nad isječcima ulaza umjesto da trpaju cijeli kontekst u jedno okno. Na OOLONG benchmark zadatku s 128k tokena RLM agenti postigli su rezultat 0,79 naspram 0,44 za standardne agente, što je poboljšanje od 79 posto.

LangChain je objavio detaljan vodič i okvir za Recursive Language Models (RLM) unutar svog DeepAgents ekosustava — pristup koji adresira jedan od kroničnih problema LLM agenata: degradaciju performansi pri dugim kontekstima, poznatiju kao „context rot”.

Zašto standardni agenti gube bitku na dugim kontekstima?

Kada agent akumulira veću količinu informacija — prethodne poruke, rezultate alata, međurezultate — sve to završava u jednom kontekstnom prozoru. Modeli pri tome počinju propuštati relevantne detalje iz ranijih dijelova konteksta, zanemaruju upute ili pogrešno prioritiziraju informacije. Na zadatcima s 128k tokena standardni agenti u testiranjima redovito padaju ili otkazuju u potpunosti.

RLM pristup, koji su razvili istraživači Alex Zhang i MIT CSAIL, rješava ovaj problem strukturnom promjenom: umjesto da cijeli ulaz gurne u kontekstni prozor, model ga učita kao varijablu u REPL okruženju i rekurzivno se poziva — nad sobom ili nad subagentima — nad manjim, upravljačkim isječcima.

Kako RLM orkestracija funkcionira

Srž pristupa je code-driven orkestracija putem laganog code interpretera (QuickJS). Model piše kod koji dekomponira zadatak i pokreće rekurzivne pozive nad segmentima podataka. LangChain ovo implementira kroz „dynamic subagente” — subagente koji se dispatchaju programski kroz kod, ne sekvencijalnim pozivima alata.

Ključna prednost ovakve arhitekture je deterministička pokrivenost: petlje u kodu garantiraju da će svaki element biti obrađen, za razliku od pristupa gdje sam model procjenjuje što treba pročitati. Pipelinei se mogu granati, paralelizirati ili sekvencirati ovisno o zahtjevima zadatka. Dodatno, miješanje različitih modela kroz orkestrator i subagent slojeve omogućuje preciznu optimizaciju troška — skuplje modele reservirati za složenije korake, jeftinije za rutinu.

Rezultati benchmarkova

LangChain je testirao pristup na OOLONG benchmark zadatku — klasifikacija vijesti iz AgNews dataseta u četiri kategorije — na različitim duljinama konteksta:

Duljina konteksta	Bez REPL-a	S REPL-om (RLM)
64k tokena	0,58	0,67
128k tokena	0,44	0,79

Na 128k tokena RLM agenti postigli su rezultat 0,79 naspram 0,44 za standardne agente — relativno poboljšanje od 79 posto. Pri toj duljini konteksta, standardni agenti su u značajnom broju slučajeva potpuno otkazali. RLM agenti zadržali su visoku točnost unatoč dužoj latenciji koja je inherentna rekurzivnom pristupu.

Instalacija i primjer koda

Postavljanje DeepAgents okvira s RLM podrškom radi se jednom naredbom:

pip install -U "deepagents[quickjs]"

Osnovna inicijalizacija agenta:

from deepagents import create_deep_agent
from langchain_quickjs import CodeInterpreterMiddleware

agent = create_deep_agent(
    model="openai:gpt-5.5",
    middleware=[CodeInterpreterMiddleware()],
)

RLM orkestracija aktivira se uključivanjem ključne riječi „workflow” u promptu, što signalizira agentu da treba koristiti dinamičku subagent dispečerizaciju. Okvir podržava miješanje modela kroz slojeve, što znači da korisnici mogu specificirati različite LLM-ove za orkestrator i za subagente.

Pristup je kompatibilan s postojećim LangChain ekosustav alatima i ne zahtijeva promjenu infrastrukture — samo nadogradnju paketa i dodavanje middleware sloja pri inicijalizaciji agenta.

Česta pitanja

Što su Recursive Language Models (RLM) i zašto su korisni?

RLM-ovi su modeli koji ulaz učitavaju kao varijable u REPL okruženju i rekurzivno pozivaju sami sebe ili subagente nad manjim isječcima. Cilj je izbjeći „context rot” — pad performansi koji nastaje kad agent akumulira previše konteksta u jednom prozoru.

Kako se RLM agenti instaliraju i aktiviraju?

Instalacija se vrši naredbom `pip install -U „deepagents[quickjs]”`, a RLM orkestracija aktivira se prosljeđivanjem `CodeInterpreterMiddleware` pri kreiranju agenta funkcijom `create_deep_agent`.

Koje su prednosti code-driven orkestracije nasuprot standardnim LLM agentima?

Kod garantira determinističku pokrivenost svakog elementa kroz petlje — za razliku od modela koji sam procjenjuje što treba obraditi. Pipelines se mogu granati, paralelizirati ili sekvencirati prema potrebama zadatka, a troškovi se optimiziraju miješanjem različitih modela kroz orkestrator i subagent slojeve.

LangChain uvodi RLM agente: rekurzivni modeli postižu 79% bolje rezultate na dugim kontekstima

Zašto standardni agenti gube bitku na dugim kontekstima?

Kako RLM orkestracija funkcionira

Rezultati benchmarkova

Instalacija i primjer koda

Česta pitanja

Izvori

Povezane vijesti