Četvrtak, 7. svibnja 2026.

19 vijesti — 🔴 4 kritično , 🟡 14 važno , 🟢 1 zanimljivo

← Prethodni dan Sljedeći dan →

🤖 Modeli (3)

📦 Open Source (1)

⚖️ Regulacija (1)

🤝 Agenti (5)

🔴 🤝 Agenti 7. svibnja 2026. · 2 min čitanja

arXiv:2605.06651: Google DeepMind predstavlja AI Co-Mathematician s 48% na FrontierMath Tier 4

Editorial illustration: 2605.06651: Google DeepMind predstavlja AI Co-Mathematician s 48% na FrontierMath Tier 4

Google DeepMind tim objavio je rad o AI Co-Mathematicianu, interaktivnoj radnoj površini gdje agenti surađuju s matematičarima na otvorenim problemima. Sustav je postigao 48% na FrontierMath Tier 4 benchmarku — novi rekord među svim AI sustavima.

🟡 🤝 Agenti 7. svibnja 2026. · 2 min čitanja

Anthropic: Managed Agents dobivaju multiagent sesije, Outcomes, webhooks i vault refresh u javnoj beti

Editorial illustration: dijagram više Claude agenata povezanih u jedan session canvas s vault i webhook ikonama

Claude Managed Agents su Anthropic-ova upravljana platforma za autonomne agente koja je 6. svibnja 2026. dobila četiri nova feature-a u javnoj beti: multiagent sesije, Outcomes mehanizam za definiranje ciljeva, webhooks za session i vault lifecycle događaje, te background refresh za mcp_oauth credentials. Dodani su i novi filteri za sesije po statusu i za eventove po tipu i vremenu kreiranja.

🟡 🤝 Agenti 7. svibnja 2026. · 2 min čitanja

GitHub: validacija agentskog ponašanja preko dominator analize iz teorije kompilatora postiže 100 % točnost vs 82 % agent self-assessment

Editorial illustration: dijagram graf strukture s istaknutim dominator čvorovima koji predstavljaju esencijalne korake u agentskom izvršavanju

GitHub objavljuje validacijski okvir za nedeterminističke AI agente koji posuđuje dominator analizu iz teorije kompilatora — iz 2 do 10 uspješnih izvršavanja Copilot Coding Agenta sustav uči koji su koraci esencijalni, a koji opcionalni, te postiže 100 % točnost u razlikovanju agentskih bugova od pravih regresija proizvoda.

🟡 🤝 Agenti 7. svibnja 2026. · 2 min čitanja

GitHub: Copilot za VS Code dobiva pristup terminalima i vlastite API ključeve

Editorial illustration: Copilot za VS Code dobiva pristup terminalima i vlastite API ključeve

GitHub Copilot za Visual Studio Code u travanjskom je ciklusu (verzije 1.116-1.119) dobio semantičku pretragu kroz cijelu bazu koda, agentski pristup otvorenim terminalima i mogućnost priključivanja vlastitih API ključeva za Anthropic, OpenAI i druge davatelje.

🟡 🤝 Agenti 7. svibnja 2026. · 2 min čitanja

vLLM: integracija Mooncake distributed KV cache storea donosi 3,8× veći throughput i 46× nižu P50 TTFT za multi-turn agentske workloade

Editorial illustration: mreža GPU čvorova povezanih RDMA linkovima sa centralnim distributed KV cache poolom

vLLM integrira Mooncake distributed KV cache store koji eliminira ponovljeno računanje prefiksa između agentskih turnova — na realističnim Codex traceovima na 12 GB200 GPU-ova throughput raste 3,8×, P50 TTFT pada 46×, end-to-end latencija 8,6×, a cache hit rate skače s 1,7 % na 92,2 %.

🔧 Hardware (1)

🏥 U praksi (4)

🟡 🏥 U praksi 7. svibnja 2026. · 2 min čitanja

Anthropic: Claude Code v2.1.132 donosi 25+ popravaka i nove env varijable za hookove

Editorial illustration: Claude Code v2.1.132 donosi 25+ popravaka i nove env varijable za hookove

Anthropic je objavio Claude Code v2.1.132 sa 25+ ispravaka i dvije nove varijable okruženja: CLAUDE_CODE_SESSION_ID za hook integraciju i CLAUDE_CODE_DISABLE_ALTERNATE_SCREEN za native scrollback. Riješen je i ozbiljan bug s 10GB+ RSS rastom memorije kod MCP servera.

🟡 🏥 U praksi 7. svibnja 2026. · 2 min čitanja

Anthropic: Claude Code v2.1.133 donosi worktree.baseRef i popravak race conditiona

Editorial illustration: Claude Code v2.1.133 donosi worktree.baseRef i popravak race conditiona

Anthropic je objavio Claude Code v2.1.133 s novim parametrima worktree.baseRef, sandbox.bwrapPath/socatPath i okolišnom varijablom CLAUDE_EFFORT u hookovima. Verzija popravlja race condition u paralelnim sesijama i probleme na Windows drive root putanjama. Treći release ovog tjedna nakon v2.1.131 i v2.1.132.

🟡 🏥 U praksi 7. svibnja 2026. · 2 min čitanja

GitHub: Optimizacijom agentnih workflowa postignute uštede tokena od 19% do 62%

Editorial illustration: Optimizacijom agentnih workflowa postignute uštede tokena od 19% do 62%

GitHub je instrumentirao produkcijske agentne workflowe i identificirao tri glavna izvora rasipanja tokena: nepotrebne MCP alate, deterministično dohvaćanje podataka i pogrešno konfigurirana bash pravila. Optimizacijom je postignuta ušteda od 19% do 62% po workflowu.

🟢 🏥 U praksi 7. svibnja 2026. · 2 min čitanja

arXiv:2605.04012: SymptomAI u Fitbit aplikaciji s 13.917 pacijenata nadmašuje nezavisne kliničare u diferencijalnoj dijagnozi

Editorial illustration: korisnik razgovara sa SymptomAI agentom u Fitbit aplikaciji dok pozadinski panel prikazuje rangiranu listu dijagnoza

SymptomAI je konverzacijski AI agent integriran u Fitbit aplikaciju i testiran na otprilike 13.917 sudionika; u podskupu kliničke evaluacije njegove dijagnostičke preporuke postigle su odds ratio 2,47 u odnosu na nezavisne kliničare koji su ocjenjivali iste razgovore. Studija je preprint.

💬 Zajednica (1)

🛡️ Sigurnost (3)

← Prethodni dan Sljedeći dan →