🟡 🤝 Agenti utorak, 5. svibnja 2026. · 2 min čitanja ·

AWS Bedrock AgentCore Optimization u previewu: automatizirana petlja od produkcijskih traga do A/B testa s OpenTelemetry trace-ovima

Editorial ilustracija: zatvorena petlja produkcije, evaluacije i A/B testa oko AI agenta, simbolika optimizacije

AWS je 4. svibnja 2026. predstavio AgentCore Optimization u previewu — automatiziranu petlju koja od produkcijskih traceova proizvodi konkretne preporuke za sistemski prompt i opise alata, batch evaluaciju protiv test seta i A/B testove sa statističkom značajnošću. Sustav prikuplja OpenTelemetry-kompatibilne trace-ove svake model pozicije, tool poziva i koraka zaključivanja, čime se ručno pogađanje ispravki zamjenjuje strukturiranim ciklusom temeljenom na produkcijskim podacima.

🤖

Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.

AWS je 4. svibnja 2026. na svom Machine Learning blogu predstavio AgentCore Optimization kao novu preview funkcionalnost unutar Amazon Bedrocka. Cilj sustava je da poboljša radne agente u produkciji bez ručnog mijenjanja promptova i pogađanja, koje je do sada bilo standardni način optimizacije.

Što sustav konkretno automatizira?

AgentCore Optimization donosi tri ključne komponente:

  1. Recommendations — analiziraju produkcijske trace-ove i rezultate evaluacije te predlažu konkretne izmjene sistemskog prompta ili opisa alata. Inženjer ne piše prijedlog; sustav ga generira iz stvarnih podataka.
  2. Batch evaluation — testira preporuke protiv unaprijed definiranog test seta da provjeri jesu li promjene poboljšanje u širem slučaju, a ne samo na primjeru koji je trigerirao preporuku.
  3. A/B testing — kontrolirani pokus između stare i nove verzije agenta s podacima o statističkoj značajnosti, čime se izbjegavaju ishitreni “subjektivno bolje” deployi.

Kako sustav prikuplja podatke iz produkcije?

End-to-end traceability u AgentCoreu bilježi svaki model poziv, tool poziv i korak zaključivanja kao OpenTelemetry-kompatibilan trace (OpenTelemetry — otvoreni standard za distribuirano praćenje sustava). Kompanije koje već koriste OTEL u svojem stacku mogu importirati postojeću infrastrukturu bez dodatnog instrumentiranja.

Posljedica je da AgentCore Optimization radi na stvarnim produkcijskim primjerima, a ne na sintetičkim testovima koje su inženjeri ručno složili. Sustav vidi koje promptove agent dobiva u realnim uvjetima, gdje pogriješi i kako se pogreška širi kroz tool pozive.

Što ovo mijenja u operativnom upravljanju agentima?

Većina enterprise agenata u 2026. zaglavi se u fazi između POC-a i pune produkcije. Razlog je da tim nema sustavni način da mjeri kako prompt promjene utječu na ponašanje. AgentCore Optimization adresira točno taj jaz: sustav postaje uređaj koji uči iz produkcijskih podataka i predlaže izmjene s mjerljivim učinkom.

AWS u blog post-u koristi primjer Market Trends Agenta za investicijske brokere, ali ne navodi konkretne benchmark brojeve. To znači da je preview faza fokusirana na demonstraciju arhitekture, ne na prodaju kvantifikatibilnih rezultata.

Cijena nije javno objavljena. Preview je dostupan korisnicima Amazon Bedrocka u zemljama gdje je AgentCore već dostupan.

Česta pitanja

Što AgentCore Optimization automatizira?
Tri stvari: (1) Recommendations koje analiziraju produkcijske trace-ove i evaluacijske rezultate da predlože izmjene sistemskog prompta ili opisa alata, (2) Batch evaluation protiv unaprijed definiranog test seta, (3) A/B testiranje između verzija agenta s podacima o statističkoj značajnosti.
Kako se prikupljaju produkcijski trace-ovi?
Kroz end-to-end traceability AgentCore-a koji bilježi svaki model poziv, tool poziv i korak zaključivanja kao OpenTelemetry-kompatibilan trace. Razvojni timovi mogu importirati postojeću OTEL infrastrukturu bez dodatne instrumentacije.
Što je glavni doprinos sustava nasuprot ručnoj optimizaciji agenata?
Zamjenjuje pogađanje ispravki strukturom: produkcijski podatak → preporuka → validacija prije deploya. Dosadašnji workflow tražio je da inženjer čita trace-ove, ručno mijenja prompt i nada se da promjena radi — sad se ciklus mjeri.