Microsoft: 2026 Agent Confidence Index — 300 graditelja, prosječno povjerenje u AI agente 64/100
2026 Agent Confidence Index je istraživanje koje je Microsoft proveo s MIT Technology Review Insights, anketirajući 300 tehničkih stručnjaka iz 12 industrija o povjerenju u AI agente za 101 zadatak. Prosječna ocjena iznosi 64/100; samo 30 zadataka prelazi prag od 70 bodova, a 59% stručnjaka kao primarnu brigu navodi zadržavanje čovjeka u nadzornoj petlji.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
Što je Agent Confidence Index?
Microsoft je u suradnji s MIT Technology Review Insights proveo anketu na uzorku od 300 tehničkih stručnjaka (AI, data i cloud domene) iz 12 industrija i 4 globalne regije. Cilj: izmjeriti koliko stručnjaci zaista vjeruju AI agentima na 101 radnom zadatku. Prosječna ocjena iznosi 64 od 100. Samo 30 zadataka prelazi prag od 70 bodova — signal da je povjerenje selektivno, a ne opće.
Rutinski zadaci dominiraju, složeni kasne
Agent Confidence Index bilježi jasnu raspodjelu: visoko povjerenje za predvidive, repetitivne zadatke — niže za one koji zahtijevaju procjenu ili nose visok rizik od pogreške. Automatizacija izvještaja postigla je 83,5/100, generiranje boilerplate koda 82,5, monitoring SSL certifikata 81,5, a praćenje podatkovnih tokova u stvarnom vremenu 80,5. Nasuprot tome, migracija sheme baze podataka stoji na svega 46,5, a detekcija memorijskih curenja na 48,5. Rutinski, automatizirani zadaci nose do 37 bodova više od zadataka koji uključuju odgovornost ili kreativno zaključivanje. Microsoft Agent Confidence Index tu razliku opisuje formulom: “Najviše ocjene klasteriraju se oko rada koji je istovremeno predvidiv i iscrpljujući.”
59% ispitanika kao primarnu brigu navodi “zadržavanje čovjeka u petlji” (human-in-the-loop) — model nadzora u kojemu čovjek ostaje u procesu AI odlučivanja kao kontrolna točka ili odobrenje. Dodatnih 53% traži veću observabilnost sustava, a 42% protokole za privatnost dokumentacije.
Karijerske prilike: SRE, QA i data timovi gledaju s optimizmom
Više od 80% stručnjaka u ulogama SRE operacija, kontrole kvalitete (QA/evaluation) i upravljanja data pipelineovima vidi pozitivne karijerske prilike uz rastuću primjenu AI agenata. Microsoft Agent Confidence Index dokumentira promjenu uloga: stručnjaci umjesto repetitivnih zadataka preuzimaju nadzornu i stratešku poziciju — i tu promjenu većina percipira kao napredak, ne kao prijetnju.
Česta pitanja
- Koji su zadaci na vrhu ljestvice Agent Confidence Index i što im je zajedničko?
- Vrh zauzimaju automatizacija izvještaja (83,5/100), generiranje boilerplate koda (82,5) i monitoring SSL certifikata (81,5). Zajednički nazivnik su rutinski, predvidivi zadaci s jasnim ishodom — za razliku od kreativnih ili visokorizičnih zadataka koji bilježe znatno niže ocjene.
- Što znači 'human-in-the-loop' i zašto to brine 59% ispitanika?
- Human-in-the-loop označava model nadzora u kojemu čovjek ostaje u procesu AI odlučivanja kao kontrolna točka ili odobrenje. Stručnjaci žele osigurati da agenti ne djeluju autonomno u zadacima visokog rizika bez ljudske provjere, što 59% ispitanika navodi kao primarnu brigu pri usvajanju agenata.
Povezane vijesti
arXiv:2606.27483: Internalizing the Future — jedinstvena paradigma treniranja za svjetski model planiranja LLM agenata
LangChain: Dynamic Subagents u Deep Agents — agent piše kod koji paralelno dispatcha stotine podagenata
Microsoft Research: Memora — memorija AI agenata uz do 98% manje tokena i SOTA na dugim razgovorima