🟡 🛡️ Sigurnost Objavljeno: · 2 min čitanja ·

Microsoft Research: LLM-ovi kvare dokumente kroz iterativno delegiranje — 19-34 % fidelity degradacija u 20 iteracija

Editorial illustration: dokument koji se kroz iteracije pomalo kvari s degradation indikatorima.

Further Notes on AI Delegation and Long-Horizon Reliability je novi Microsoft Research blog objavljen 15. svibnja 2026. autora Philippe Laban, Tobias Schnabel i Jennifer Neville. Follow-up na originalni paper LLMs Corrupt Your Documents When You Delegate. Istraživanje pokazuje 19-34 % fidelity degradaciju kroz 20 iteracija delegiranja editiranja dokumenata; problem je sistemski i pojavljuje se kroz različite modele, a posebno utječe na long-horizon agentne workflowove.

🤖

Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.

Microsoft Research tim Philippe Laban, Tobias Schnabel i Jennifer Neville objavili su 15. svibnja 2026. blog post “Further Notes on Our Recent Research on AI Delegation and Long-Horizon Reliability” — follow-up na njihov originalni paper koji je dramatično signalizirao ozbiljnu pouzdanostnu praznoću u suvremenim agentnim sustavima.

Što originalni paper otkrio?

Originalni rad “LLMs Corrupt Your Documents When You Delegate” demonstrirao je da iterativno delegiranje editiranja dokumenata kvari sadržaj kroz uzastopne AI iteracije. Tim je mjerio fidelity score — koliko se kvaliteta, točnost i koherentnost dokumenta očuvaju kroz delegiranje cikluse — i otkrio da modeli sustavno gube informaciju kroz iteracije, čak i kad svaka pojedinačna iteracija izgleda razumno.

Koje brojke paper konkretno daje?

Kroz 20 iteracija delegiranja, fidelity degradacija doseže 19-34 % ovisno o tipu zadatka i konkretnom modelu. Brojka je značajna jer pretvara problem iz “ponekad model napravi grešku” u “sistemski degradacijski signal koji se kumulira eksponencijalno”. Nakon 20 iteracija dokument više nije pouzdana reprezentacija originalnog content-a — što je upravo broj iteracija koji long-running agent workflowi tipično prelaze.

Što follow-up blog post razjašnjava?

Tim je objavio follow-up jer je originalni paper izazvao značajnu raspravu i autori su htjeli “clarify several important points about what the paper does—and does not—claim”. Blog post adresira:

  • Generalnost problema — radi li ovo o specifičnom modelu ili sustavnoj klasi problema?
  • Mitigation strategies — koji pristup pomaže smanjiti degradaciju?
  • Implikacije za production agente — koji workflowi su najteže pogođeni?

Što ovaj nalaz znači za agentne workflowove?

Long-horizon agentni workflowi najteže su pogođeni. Tipični primjeri: research agenti koji generiraju, edituju i prosljeđuju draft-ove; multi-step document automation gdje pojedinačni dokument prolazi kroz desetke transformacija; kontinuirane summarization cycles gdje agent reducira veliki korpus kroz iterativno sažimanje.

Rad implicitno opovrgava popularnu predodžbu da je agent reliability problem rješiv samo kroz bolji model — degradacija pattern je dovoljno sustavan da sugerira potrebu za arhitektonskim solucijama: ground truth retention, periodic verification protiv originala, explicit revisional review pre nego što agent prosljedi.

Pristup nadovezuje se na 2026 tjedan dramatičnih safety/reliability papira — arXiv:2605.13825 History Anchors (14.5.), arXiv:2605.12474 Reward Hacking Rubric (13.5.), arXiv:2605.11882 FATE Safety (13.5.). Microsoft Research kombinacija s tim arXiv valom signalizira sazrijavanje agentic reliability research kao zasebnog discipline.

Česta pitanja

Što istraživanje konkretno mjeri?
Tim mjeri fidelity degradaciju — koliko se kvaliteta i točnost sadržaja smanjuje kroz uzastopne iteracije AI delegiranja editiranja istog dokumenta; nakon 20 iteracija degradacija doseže 19-34 % ovisno o tipu zadatka i modelu.
Što ovaj nalaz znači za agentne workflowove?
Long-horizon agentni workflowi (research agenti, multi-step document automation, kontinuirane summary cycles) najteže su pogođeni — svako delegiranje uvodi malu degradaciju koja se kumulativno akumulira i sustavno kvari output kroz vrijeme.