Srijeda, 20. svibnja 2026.

18 vijesti — 🔴 2 kritično , 🟡 10 važno , 🟢 6 zanimljivo

← Prethodni dan Sljedeći dan →

🤖 Modeli (4)

🔴 🤖 Modeli 20. svibnja 2026. · 3 min čitanja

Google: Gemini 3.5 Flash i Pro — najbrži frontier modeli do sada

Editorial illustration: Google je na Google I/O 2026 predstavio Gemini 3.5 Flash i Pro — frontier modele koji su 4× brži od

Google je na Google I/O 2026 predstavio Gemini 3.5 Flash i Pro — frontier modele koji su 4× brži od konkurencije, s posebnim naglaskom na agentske zadatke, novu platformu Antigravity 2.0 za razvojne programere i Gemini Spark, osobnog AI agenta dostupnog 24/7.

🔴 🤖 Modeli 20. svibnja 2026. · 3 min čitanja

Google: Gemini Omni Flash donosi nativnu video generaciju iz mješovitih inputa

Editorial illustration: Google je na I/O 2026 predstavio Gemini Omni Flash — novi multimodalni model koji generira i uređuje

Google je na I/O 2026 predstavio Gemini Omni Flash — novi multimodalni model koji generira i uređuje video iz kombinacije slika, zvuka, videa i teksta. Dostupan odmah na YouTube Shortsima, uz obavezni SynthID digitalni vodeni žig na svakom generiranom isječku.

🟡 🤖 Modeli 20. svibnja 2026. · 2 min čitanja

Google: ERA — AI sustav koji automatizira pisanje znanstvenog koda

Editorial illustration:

Google je u časopisu Nature objavio ERA (Empirical Research Assistance) — Gemini-powered sustav koji tree-searchom evaluira tisuće računalnih pristupa i automatizira pisanje ekspertnog znanstvenog softvera. Platforma Computational Discovery već je dostupna istraživačima kroz Google Labs.

🟢 🤖 Modeli 20. svibnja 2026. · 2 min čitanja

arXiv:2605.19660: OScaR — INT2 kvantizacija KV cachea donosi 3× brži decoding

Editorial illustration: Istraživači su objavili OScaR, metodu koja rješava temeljni problem kvantizacije KV cachea u velikim

Istraživači su objavili OScaR, metodu koja rješava temeljni problem kvantizacije KV cachea u velikim jezičnim modelima. Koristeći INT2 preciznost — svega 2 bita po vrijednosti — postiže gotovo bez gubitka točnosti, 3× brži decoding, 5,3× manje memorije i 4,1× veći throughput u usporedbi s BF16 FlashDecoding-v2.

📦 Open Source (1)

⚖️ Regulacija (3)

🤝 Agenti (7)

🟡 🤝 Agenti 20. svibnja 2026. · 2 min čitanja

Anthropic Claude Code: Scripting živih sesija i sigurnosni popravci u v2.1.145

Editorial illustration:

Claude Code v2.1.145 donosi JSON ispis živih sesija za skriptiranje, proširene OTEL trace atribute za praćenje agenata te popravke sigurnosnog propusta pri odobravanju bash naredbi. Ažuriranje je dostupno putem npm install -g @anthropic-ai/claude-code.

🟡 🤝 Agenti 20. svibnja 2026. · 2 min čitanja

Anthropic: Claude za 276.000 KPMG zaposlenika u 138 zemalja

Editorial illustration: Anthropic i KPMG sklopili su stratešku globalnu alijansu kojom Claude dobiva pristup svim zaposlenic

Anthropic i KPMG sklopili su stratešku globalnu alijansu kojom Claude dobiva pristup svim zaposlenicima jedne od četiri najveće revizorske tvrtke na svijetu. Claude se ugrađuje u KPMG-ov Digital Gateway, a KPMG postaje Anthropicov preferred partner za sektor privatnog kapitala.

🟡 🤝 Agenti 20. svibnja 2026. · 2 min čitanja

AWS: Tri arhitekturna uzorka za skalabilne glasovne agente s Amazon Nova Sonic

Editorial illustration:

AWS je objavio detaljan vodič za skalabilne glasovne agente koji koriste Amazon Nova Sonic i AgentCore Gateway. Tri arhitekturna uzorka — direktni alati, sub-agenti i segmentacija sesija — nude različite kompromise između latencije i operativne složenosti.

🟡 🤝 Agenti 20. svibnja 2026. · 2 min čitanja

GitHub Copilot dobiva Gemini 3.5 Flash: brzina i kvaliteta za svakodnevno kodiranje

Editorial illustration: Google-ov Gemini 3.5 Flash model postaje općenito dostupan za sve GitHub Copilot planove. Obećava kv

Google-ov Gemini 3.5 Flash model postaje općenito dostupan za sve GitHub Copilot planove. Obećava kvalitetu blisku Pro-razini uz brzinu i niži trošak Flash-tiera, s naglaskom na agentic radne tokove i višestruka IDE okruženja.

🟢 🤝 Agenti 20. svibnja 2026. · 2 min čitanja

arXiv:2605.18703: EnvFactory – RL trening agenata za alate s 5× manjim skupom okruženja

Editorial illustration:

EnvFactory je novi okvir koji automatski sintetizira izvršna okruženja za trening tool-use agenata. Na Qwen3 modelima postiže +15% na BFCLv3 i +8.6% na MCP-Atlas benchmarku koristeći svega 85 verificiranih okruženja — pet puta manje od usporednih pristupa.

🟢 🤝 Agenti 20. svibnja 2026. · 2 min čitanja

arXiv:2605.18565: LongMINT — zašto AI agenti zaboravljaju sve što im kažeš

Editorial illustration:

LongMINT je prvi benchmark koji mjeri upravljanje memorijom AI agenata u dugim dinamičnim scenarijima. S 15.600 pitanje-odgovor parova i kontekstom do 1,8 milijuna tokena, prosječna točnost testiranih sustava iznosi samo 27,9% — slabije od slučajnog pogađanja u velikom broju slučajeva.

🟢 🤝 Agenti 20. svibnja 2026. · 2 min čitanja

arXiv:2605.20173: 6 arhitektonskih obrazaca za produkcijske LLM agente

Editorial illustration: Novi arXiv rad uvodi stochastic-deterministic boundary kao temeljni dizajn princip produkcijskih LLM

Novi arXiv rad uvodi stochastic-deterministic boundary kao temeljni dizajn princip produkcijskih LLM agenata te definira 6 composable runtime obrazaca — od hijerarhijske delegacije do human-in-the-loop — koji se biraju prema tri arhitektonske brige: koordinaciji, stanju i kontroli.

🛡️ Sigurnost (3)

← Prethodni dan Sljedeći dan →