ArXiv: SWE-AGILE — kako mali modeli rješavaju eksploziju konteksta u kodnim agentima

SWE-AGILE uvodi strategiju dinamičnog konteksta s kliznim prozorom i komprimiranim sažecima za AI kodne agente. S modelom od samo 7-8B parametara postiže novi state-of-the-art na SWE-Bench-Verified, koristeći samo 2.200 trening primjera.

Jedan od najvećih izazova za autonomne AI kodne agente je “eksplozija konteksta” — što više koraka agent napravi, to više informacija mora držati u memoriji, a kontekstni prozor se brzo puni.

Rješenje: dinamični kontekst

SWE-AGILE uvodi strategiju Dynamic Reasoning Context koja koristi dva mehanizma:

Klizni prozor detaljnog rasuđivanja — zadnjih nekoliko koraka agenta zadržava se u punom obliku za precizno donošenje odluka
Reasoning Digests — komprimirani sažeci starijih koraka koji čuvaju ključne informacije bez zauzimanja previše prostora

Ovaj pristup omogućuje agentu da zadrži “veliku sliku” projekta dok istovremeno ima detaljan uvid u trenutni zadatak.

Impresivni rezultati s malim modelom

Najznačajniji aspekt rada je da SWE-AGILE postiže novi state-of-the-art za modele veličine 7-8B parametara na SWE-Bench-Verified benchmarku:

Koristi samo 2.200 trening primjera i 896 zadataka
Konkurira znatno većim modelima zahvaljujući efikasnom upravljanju kontekstom
Kod je javno dostupan na GitHubu

Zašto je to zanimljivo?

U svijetu gdje se AI kodiranje uglavnom oslanja na ogromne modele s velikim kontekstnim prozorima, SWE-AGILE pokazuje da pametnije upravljanje kontekstom može kompenzirati veličinu modela. To otvara vrata za učinkovitije i jeftinije AI kodne agente koji mogu raditi na skromnijem hardveru.

ArXiv: SWE-AGILE — kako mali modeli rješavaju eksploziju konteksta u kodnim agentima

Rješenje: dinamični kontekst

Impresivni rezultati s malim modelom

Zašto je to zanimljivo?

Izvori

Povezane vijesti