Anthropic: Studija o agentskom kodiranju — korisnici donose 70% planskih, Claude 80% izvedbenih odluka
Anthropic je objavio ekonomsku studiju o agentskom kodiranju s Claude Codeom. Korisnici donose oko 70% odluka o planiranju, dok Claude preuzima oko 80% izvedbenih odluka. Stručni korisnici dobivaju 12 akcija i 3.200 riječi po promptu naspram 5 akcija i 600 riječi kod početnika, uz uspješnost provjerenih zadataka 28–33% naspram 15%. Udio debugging sesija pao je s 33% na 19% između listopada 2025. i travnja 2026., dok je prosječna vrijednost zadatka porasla oko 25%.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
Anthropic je objavio ekonomsku studiju o agentskom kodiranju s Claude Codeom koja kvantificira kako se posao dijeli između čovjeka i AI agenta.
Kako se dijele odluke između korisnika i Claudea?
Prema studiji, korisnici donose oko 70% odluka o planiranju, dok Claude preuzima oko 80% izvedbenih odluka. Drugim riječima, čovjek zadržava strateški smjer (što i zašto), a agent obavlja većinu operativne izvedbe (kako). Ta podjela rada okvir je za razumijevanje gdje ljudska ekspertiza i dalje presuđuje, a gdje agent preuzima teret.
Koliko ekspertiza utječe na rezultat?
Razlika između stručnjaka i početnika je velika. Stručni korisnici dobivaju 12 akcija i 3.200 riječi po promptu naspram 5 akcija i 600 riječi kod početnika — više od dvostruko. Uspješnost provjerenih zadataka iznosi 28–33% kod stručnih i srednjih korisnika naspram 15% kod početnika. Zanimljivo, radnici izvan softvera uspijevaju u 26% kodnih sesija, tek 4 postotna boda manje od softverskih inženjera (30%).
Kako se mijenja priroda rada s agentom?
Tijekom praćenog razdoblja udio debugging sesija pao je s 33% na 19% (listopad 2025. – travanj 2026.), dok je udio “upravljanja softverom” porastao s 14% na 21%. Prosječna vrijednost zadatka porasla je oko 25%. Trend pokazuje pomak od ispravljanja grešaka prema orkestraciji, što sugerira da agenti preuzimaju sve veći dio rutinske izvedbe.
Česta pitanja
- Kako se dijele odluke između korisnika i Claudea?
- Korisnici donose oko 70% odluka o planiranju, dok Claude preuzima oko 80% izvedbenih odluka.
- Koliko se razlikuju stručnjaci od početnika?
- Stručnjaci dobivaju 12 akcija i 3.200 riječi po promptu naspram 5 akcija i 600 riječi, uz uspješnost 28–33% naspram 15%.
Povezane vijesti
AWS: Keširanje kontejnera u SageMaker AI skraćuje skaliranje inferencije do 50%
Google DeepMind: AI alat za britansko planiranje cilja 50% brže odluke i 1,5 milijuna novih domova
Anthropic: Claude Code v2.1.178 uvodi podudaranje parametara alata u dozvolama i ugniježđene skills