Engram: bi-temporalna memorija, +10,4 boda

Q: Što je Engram?

Engram je open-source memorijski sustav za AI agente koji pokazuje da pametno dohvaćen, sažet ('lean') kontekst nadmašuje učitavanje cijele povijesti razgovora. Koristi dual-process arhitekturu temeljenu na bi-temporalnom modelu podataka. Cilj je pružiti relevantne informacije uz znatno manju potrošnju tokena.

Q: Što znači bi-temporalni model podataka?

Bi-temporalni model prati dvije vremenske dimenzije podataka — kada se nešto dogodilo i kada je to zabilježeno. To omogućuje sustavu da gradi znanje koje uvažava vremenski slijed i da razrješava kontradikcije među činjenicama. Engram na toj osnovi izgrađuje knowledge graph atomskih činjenica.

Q: Koliko je Engram bio uspješan u testovima?

Na benchmarku LongMemEval_S Engram je postigao 83,6% naspram 73,2% za full-context pristup, što je poboljšanje od 10,4 boda (McNemar p < 10⁻⁶). Koristio je oko 9,6k dohvaćenih tokena umjesto 79k, odnosno otprilike 8× manje, bez ijedne greške na svih 500 pitanja.

Engram je open-source memorijski sustav koji pokazuje da pametno dohvaćen 'lean' kontekst nadmašuje učitavanje cijele povijesti razgovora. Na benchmarku LongMemEval_S postigao je 83,6% naspram 73,2% za full-context, koristeći oko 8× manje tokena.

arXiv:2606.09900, objavljen 5. lipnja 2026. u 11:43 UTC, predstavlja Engram — open-source memorijski sustav koji pokazuje da pametno dohvaćen “lean” kontekst (sažet, ciljano odabran skup informacija) nadmašuje učitavanje cijele povijesti razgovora. Rezultati upućuju na to da više konteksta ne znači nužno bolje odgovore, već da je presudna kvaliteta dohvata.

Što je Engram i koji problem rješava?

Engram se bavi pitanjem kako AI agentu pružiti pravo znanje u pravom trenutku, bez nepotrebnog opterećenja. Uobičajeni pristup jest učitati cijelu povijest razgovora kao full-context, no to troši mnogo tokena i može unijeti šum.

Suprotno tome, Engram dohvaća samo relevantne dijelove. Time pokazuje da pažljivo odabran, sažet kontekst može dati bolje rezultate od pristupa u kojem se modelu predaje sve odjednom. Riječ je o pomaku od količine prema relevantnosti.

Kako radi dual-process arhitektura?

Engram koristi dual-process arhitekturu (arhitekturu s dvama procesima) izgrađenu na bi-temporalnom modelu podataka. Prvi proces je brzi write path koji dodaje epizode bez LLM poziva, čime je upisivanje novih informacija jeftino i brzo.

Drugi proces je asinkroni path koji u pozadini gradi bi-temporalni knowledge graph (graf znanja). On izvlači atomske činjenice i razrješava kontradikcije među njima. Takva podjela omogućuje da sustav istovremeno brzo bilježi nove podatke i postupno gradi uredan, dosljedan model znanja.

Što znači bi-temporalni model podataka?

Bi-temporalni model prati dvije vremenske dimenzije za svaku informaciju: kada se događaj dogodio i kada je zabilježen. Ova razlika omogućuje sustavu da pravilno tumači vremenski slijed događaja i da prepozna kada se neka kasnija informacija kosi s ranijom.

Upravo zahvaljujući tom modelu Engram može razrješavati kontradikcije dok gradi svoj knowledge graph. Umjesto da gomila proturječne tvrdnje, sustav održava koherentnu sliku znanja koja uvažava vrijeme.

Kakvi su rezultati na benchmarku?

Na benchmarku LongMemEval_S Engram je postigao 83,6%, naspram 73,2% za full-context pristup. To je poboljšanje od 10,4 boda, statistički vrlo uvjerljivo (McNemar p < 10⁻⁶).

Najdojmljiviji je odnos performansi i troška. Engram je koristio samo oko 9,6k dohvaćenih tokena umjesto 79k, što je otprilike 8× manje tokena. Pritom nije zabilježio nijednu grešku na svih 500 pitanja. Time se potvrđuje glavna teza rada: pametan, sažet dohvat može istovremeno biti i točniji i znatno jeftiniji od učitavanja cijele povijesti.

Zašto je ovaj pristup važan za AI agente?

Za autonomne AI agente koji vode dugotrajne razgovore ili obavljaju zadatke kroz mnogo koraka, upravljanje memorijom postaje ključno usko grlo. Kontekstni prozor modela je ograničen, a njegovo punjenje velikim količinama prošlih informacija povećava i trošak i rizik od pogrešaka.

Engram nudi praktičan odgovor na taj problem. Budući da je open-source, razvojni timovi mogu ga ugraditi u vlastite agente bez ovisnosti o zatvorenim rješenjima. Kombinacija brzog write patha bez LLM poziva i pozadinske izgradnje knowledge grapha znači da sustav može rasti zajedno s povijesti razgovora, a da pritom ne usporava interakciju. Rezultati na LongMemEval_S sugeriraju da bi takav pristup mogao postati standard u izgradnji memorijskih slojeva za agente.

Česta pitanja

Što je Engram?

Engram je open-source memorijski sustav za AI agente koji pokazuje da pametno dohvaćen, sažet ('lean') kontekst nadmašuje učitavanje cijele povijesti razgovora. Koristi dual-process arhitekturu temeljenu na bi-temporalnom modelu podataka. Cilj je pružiti relevantne informacije uz znatno manju potrošnju tokena.

Što znači bi-temporalni model podataka?

Bi-temporalni model prati dvije vremenske dimenzije podataka — kada se nešto dogodilo i kada je to zabilježeno. To omogućuje sustavu da gradi znanje koje uvažava vremenski slijed i da razrješava kontradikcije među činjenicama. Engram na toj osnovi izgrađuje knowledge graph atomskih činjenica.

Koliko je Engram bio uspješan u testovima?

Na benchmarku LongMemEval_S Engram je postigao 83,6% naspram 73,2% za full-context pristup, što je poboljšanje od 10,4 boda (McNemar p < 10⁻⁶). Koristio je oko 9,6k dohvaćenih tokena umjesto 79k, odnosno otprilike 8× manje, bez ijedne greške na svih 500 pitanja.

arXiv:2606.09900: Engram — bi-temporalni memorijski engine, +10,4 boda uz 8× manje tokena

Što je Engram i koji problem rješava?

Kako radi dual-process arhitektura?

Što znači bi-temporalni model podataka?

Kakvi su rezultati na benchmarku?

Zašto je ovaj pristup važan za AI agente?

Česta pitanja

Izvori

Povezane vijesti