LangChain uvodi RLM agente: rekurzivni modeli postižu 79% bolje rezultate na dugim kontekstima
LangChain je kroz DeepAgents okvir uveo Recursive Language Models (RLM) — pristup u kojem modeli pozivaju sami sebe nad isječcima ulaza umjesto da trpaju cijeli kontekst u jedno okno. Na OOLONG benchmark zadatku s 128k tokena RLM agenti postigli su rezultat 0,79 naspram 0,44 za standardne agente, što je poboljšanje od 79 posto.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
LangChain je objavio detaljan vodič i okvir za Recursive Language Models (RLM) unutar svog DeepAgents ekosustava — pristup koji adresira jedan od kroničnih problema LLM agenata: degradaciju performansi pri dugim kontekstima, poznatiju kao „context rot”.
Zašto standardni agenti gube bitku na dugim kontekstima?
Kada agent akumulira veću količinu informacija — prethodne poruke, rezultate alata, međurezultate — sve to završava u jednom kontekstnom prozoru. Modeli pri tome počinju propuštati relevantne detalje iz ranijih dijelova konteksta, zanemaruju upute ili pogrešno prioritiziraju informacije. Na zadatcima s 128k tokena standardni agenti u testiranjima redovito padaju ili otkazuju u potpunosti.
RLM pristup, koji su razvili istraživači Alex Zhang i MIT CSAIL, rješava ovaj problem strukturnom promjenom: umjesto da cijeli ulaz gurne u kontekstni prozor, model ga učita kao varijablu u REPL okruženju i rekurzivno se poziva — nad sobom ili nad subagentima — nad manjim, upravljačkim isječcima.
Kako RLM orkestracija funkcionira
Srž pristupa je code-driven orkestracija putem laganog code interpretera (QuickJS). Model piše kod koji dekomponira zadatak i pokreće rekurzivne pozive nad segmentima podataka. LangChain ovo implementira kroz „dynamic subagente” — subagente koji se dispatchaju programski kroz kod, ne sekvencijalnim pozivima alata.
Ključna prednost ovakve arhitekture je deterministička pokrivenost: petlje u kodu garantiraju da će svaki element biti obrađen, za razliku od pristupa gdje sam model procjenjuje što treba pročitati. Pipelinei se mogu granati, paralelizirati ili sekvencirati ovisno o zahtjevima zadatka. Dodatno, miješanje različitih modela kroz orkestrator i subagent slojeve omogućuje preciznu optimizaciju troška — skuplje modele reservirati za složenije korake, jeftinije za rutinu.
Rezultati benchmarkova
LangChain je testirao pristup na OOLONG benchmark zadatku — klasifikacija vijesti iz AgNews dataseta u četiri kategorije — na različitim duljinama konteksta:
| Duljina konteksta | Bez REPL-a | S REPL-om (RLM) |
|---|---|---|
| 64k tokena | 0,58 | 0,67 |
| 128k tokena | 0,44 | 0,79 |
Na 128k tokena RLM agenti postigli su rezultat 0,79 naspram 0,44 za standardne agente — relativno poboljšanje od 79 posto. Pri toj duljini konteksta, standardni agenti su u značajnom broju slučajeva potpuno otkazali. RLM agenti zadržali su visoku točnost unatoč dužoj latenciji koja je inherentna rekurzivnom pristupu.
Instalacija i primjer koda
Postavljanje DeepAgents okvira s RLM podrškom radi se jednom naredbom:
pip install -U "deepagents[quickjs]"
Osnovna inicijalizacija agenta:
from deepagents import create_deep_agent
from langchain_quickjs import CodeInterpreterMiddleware
agent = create_deep_agent(
model="openai:gpt-5.5",
middleware=[CodeInterpreterMiddleware()],
)
RLM orkestracija aktivira se uključivanjem ključne riječi „workflow” u promptu, što signalizira agentu da treba koristiti dinamičku subagent dispečerizaciju. Okvir podržava miješanje modela kroz slojeve, što znači da korisnici mogu specificirati različite LLM-ove za orkestrator i za subagente.
Pristup je kompatibilan s postojećim LangChain ekosustav alatima i ne zahtijeva promjenu infrastrukture — samo nadogradnju paketa i dodavanje middleware sloja pri inicijalizaciji agenta.
Česta pitanja
- Što su Recursive Language Models (RLM) i zašto su korisni?
- RLM-ovi su modeli koji ulaz učitavaju kao varijable u REPL okruženju i rekurzivno pozivaju sami sebe ili subagente nad manjim isječcima. Cilj je izbjeći „context rot” — pad performansi koji nastaje kad agent akumulira previše konteksta u jednom prozoru.
- Kako se RLM agenti instaliraju i aktiviraju?
- Instalacija se vrši naredbom `pip install -U „deepagents[quickjs]”`, a RLM orkestracija aktivira se prosljeđivanjem `CodeInterpreterMiddleware` pri kreiranju agenta funkcijom `create_deep_agent`.
- Koje su prednosti code-driven orkestracije nasuprot standardnim LLM agentima?
- Kod garantira determinističku pokrivenost svakog elementa kroz petlje — za razliku od modela koji sam procjenjuje što treba obraditi. Pipelines se mogu granati, paralelizirati ili sekvencirati prema potrebama zadatka, a troškovi se optimiziraju miješanjem različitih modela kroz orkestrator i subagent slojeve.
Povezane vijesti
Claude Code v2.1.198: background agenti sada sami otvaraju PR-ove, stigao /dataviz skill
AWS objavljuje serverless A2A gateway koji zamjenjuje 190 point-to-point veza središnjim registrom
AWS AgentCore Memory dobiva filtriranje metapodacima — točnost skočila s 40% na 64%