Srijeda, 20. svibnja 2026.

18 vijesti — 🔴 2 kritično , 🟡 10 važno , 🟢 6 zanimljivo

🤖 Modeli (4)

🔴 🤖 Modeli 20. svibnja 2026. · 3 min čitanja

Google: Gemini 3.5 Flash i Pro — najbrži frontier modeli do sada

Editorial illustration: Google je na Google I/O 2026 predstavio Gemini 3.5 Flash i Pro — frontier modele koji su 4× brži od

Google je na Google I/O 2026 predstavio Gemini 3.5 Flash i Pro — frontier modele koji su 4× brži od konkurencije, s posebnim naglaskom na agentske zadatke, novu platformu Antigravity 2.0 za razvojne programere i Gemini Spark, osobnog AI agenta dostupnog 24/7.

🔴 🤖 Modeli 20. svibnja 2026. · 3 min čitanja

Google: Gemini Omni Flash donosi nativnu video generaciju iz mješovitih inputa

Editorial illustration: Google je na I/O 2026 predstavio Gemini Omni Flash — novi multimodalni model koji generira i uređuje

Google je na I/O 2026 predstavio Gemini Omni Flash — novi multimodalni model koji generira i uređuje video iz kombinacije slika, zvuka, videa i teksta. Dostupan odmah na YouTube Shortsima, uz obavezni SynthID digitalni vodeni žig na svakom generiranom isječku.

🟡 🤖 Modeli 20. svibnja 2026. · 2 min čitanja

Google: ERA — AI sustav koji automatizira pisanje znanstvenog koda

Google je u časopisu Nature objavio ERA (Empirical Research Assistance) — Gemini-powered sustav koji tree-searchom evaluira tisuće računalnih pristupa i automatizira pisanje ekspertnog znanstvenog softvera. Platforma Computational Discovery već je dostupna istraživačima kroz Google Labs.

🟢 🤖 Modeli 20. svibnja 2026. · 2 min čitanja

arXiv:2605.19660: OScaR — INT2 kvantizacija KV cachea donosi 3× brži decoding

Editorial illustration: Istraživači su objavili OScaR, metodu koja rješava temeljni problem kvantizacije KV cachea u velikim

Istraživači su objavili OScaR, metodu koja rješava temeljni problem kvantizacije KV cachea u velikim jezičnim modelima. Koristeći INT2 preciznost — svega 2 bita po vrijednosti — postiže gotovo bez gubitka točnosti, 3× brži decoding, 5,3× manje memorije i 4,1× veći throughput u usporedbi s BF16 FlashDecoding-v2.

📦 Open Source (1)

🟢 📦 Open Source 20. svibnja 2026. · 2 min čitanja

LangChain: Agent koji popravlja agente — kako je izgrađen LangSmith Engine

LangChain je objavio tehnički pregled LangSmith Enginea — autonomnog meta-agenta koji analizira greške u produkcijskim AI agentima i predlaže konkretne popravke. Engine automatizira detekciju grešaka, generiranje evaluatora i regresijskih testova end-to-end.

⚖️ Regulacija (3)

🟡 ⚖️ Regulacija 20. svibnja 2026. · 2 min čitanja

Google DeepMind i Singapur: Nacionalno partnerstvo za AI u zdravstvu, obrazovanju i okolišu

Editorial illustration: Google DeepMind potpisao je nacionalno AI partnerstvo sa singapurskom vladom koje pokriva zdravstvo,

Google DeepMind potpisao je nacionalno AI partnerstvo sa singapurskom vladom koje pokriva zdravstvo, obrazovanje i održivost. Do 2040. AI bi mogao singapurskom gospodarstvu donijeti dodatnih 2,5 milijardi dolara kroz ubrzani R&D.

🟡 ⚖️ Regulacija 20. svibnja 2026. · 2 min čitanja

OpenAI: Nova faza programa AI obrazovanja za države

Editorial illustration: OpenAI ulazi u drugu fazu inicijative Education for Countries — proširuje partnerstva s vladama, uvo

OpenAI ulazi u drugu fazu inicijative Education for Countries — proširuje partnerstva s vladama, uvodi program OpenAI Luminaries za nastavnike i nudi certifikate kroz OpenAI Academy. Cilj je sustavna integracija AI alata u nacionalne obrazovne sustave uz mjerenje stvarnog učinka.

🟢 ⚖️ Regulacija 20. svibnja 2026. · 2 min čitanja

OECD: EU uvodi AI u strateški važne sektore — što to znači za građane?

OECD.AI i EU AI Office dokumentirali su kako Europa raspoređuje AI u četiri strateška sektora: poljoprivredu, zdravstvo, industriju i mobilnost. Projekti poput Robs4Crops, European Cancer Imaging Initiative i AI4Cities već su u tijeku, no fragmentacija podataka i manjak digitalnih vještina koče širu primjenu.

🤝 Agenti (7)

🟡 🤝 Agenti 20. svibnja 2026. · 2 min čitanja

Anthropic Claude Code: Scripting živih sesija i sigurnosni popravci u v2.1.145

Claude Code v2.1.145 donosi JSON ispis živih sesija za skriptiranje, proširene OTEL trace atribute za praćenje agenata te popravke sigurnosnog propusta pri odobravanju bash naredbi. Ažuriranje je dostupno putem npm install -g @anthropic-ai/claude-code.

🟡 🤝 Agenti 20. svibnja 2026. · 2 min čitanja

Anthropic: Claude za 276.000 KPMG zaposlenika u 138 zemalja

Editorial illustration: Anthropic i KPMG sklopili su stratešku globalnu alijansu kojom Claude dobiva pristup svim zaposlenic

Anthropic i KPMG sklopili su stratešku globalnu alijansu kojom Claude dobiva pristup svim zaposlenicima jedne od četiri najveće revizorske tvrtke na svijetu. Claude se ugrađuje u KPMG-ov Digital Gateway, a KPMG postaje Anthropicov preferred partner za sektor privatnog kapitala.

🟡 🤝 Agenti 20. svibnja 2026. · 2 min čitanja

AWS: Tri arhitekturna uzorka za skalabilne glasovne agente s Amazon Nova Sonic

AWS je objavio detaljan vodič za skalabilne glasovne agente koji koriste Amazon Nova Sonic i AgentCore Gateway. Tri arhitekturna uzorka — direktni alati, sub-agenti i segmentacija sesija — nude različite kompromise između latencije i operativne složenosti.

🟡 🤝 Agenti 20. svibnja 2026. · 2 min čitanja

GitHub Copilot dobiva Gemini 3.5 Flash: brzina i kvaliteta za svakodnevno kodiranje

Editorial illustration: Google-ov Gemini 3.5 Flash model postaje općenito dostupan za sve GitHub Copilot planove. Obećava kv

Google-ov Gemini 3.5 Flash model postaje općenito dostupan za sve GitHub Copilot planove. Obećava kvalitetu blisku Pro-razini uz brzinu i niži trošak Flash-tiera, s naglaskom na agentic radne tokove i višestruka IDE okruženja.

🟢 🤝 Agenti 20. svibnja 2026. · 2 min čitanja

arXiv:2605.18703: EnvFactory – RL trening agenata za alate s 5× manjim skupom okruženja

EnvFactory je novi okvir koji automatski sintetizira izvršna okruženja za trening tool-use agenata. Na Qwen3 modelima postiže +15% na BFCLv3 i +8.6% na MCP-Atlas benchmarku koristeći svega 85 verificiranih okruženja — pet puta manje od usporednih pristupa.

🟢 🤝 Agenti 20. svibnja 2026. · 2 min čitanja

arXiv:2605.18565: LongMINT — zašto AI agenti zaboravljaju sve što im kažeš

LongMINT je prvi benchmark koji mjeri upravljanje memorijom AI agenata u dugim dinamičnim scenarijima. S 15.600 pitanje-odgovor parova i kontekstom do 1,8 milijuna tokena, prosječna točnost testiranih sustava iznosi samo 27,9% — slabije od slučajnog pogađanja u velikom broju slučajeva.

🟢 🤝 Agenti 20. svibnja 2026. · 2 min čitanja

arXiv:2605.20173: 6 arhitektonskih obrazaca za produkcijske LLM agente

Editorial illustration: Novi arXiv rad uvodi stochastic-deterministic boundary kao temeljni dizajn princip produkcijskih LLM

Novi arXiv rad uvodi stochastic-deterministic boundary kao temeljni dizajn princip produkcijskih LLM agenata te definira 6 composable runtime obrazaca — od hijerarhijske delegacije do human-in-the-loop — koji se biraju prema tri arhitektonske brige: koordinaciji, stanju i kontroli.

🛡️ Sigurnost (3)

🟡 🛡️ Sigurnost 20. svibnja 2026. · 2 min čitanja

arXiv:2605.18414: Promptovi ne štite — MCP proxy s ABAC-om postiže 0% neovlaštenih poziva alata

Novo istraživanje dokazuje da prompt-based restrikcije smanjuju neovlaštene invokacije alata samo 11–18%, dok arhitekturalni MCP proxy s ABAC-om postiže potpunu zaštitu uz manje od 50 ms latencije. Istraživanje je planirano za EMNLP 2026 Industry Track.

🟡 🛡️ Sigurnost 20. svibnja 2026. · 2 min čitanja

CNCF: Prempti donosi policy enforcement i vidljivost za AI coding agente

Editorial illustration: CNCF Falco tim objavio je Prempti — eksperimentalni projekt koji proširuje Falcov model runtime sigu

CNCF Falco tim objavio je Prempti — eksperimentalni projekt koji proširuje Falcov model runtime sigurnosti na AI coding agente. Sustav presreće tool callove prije izvršenja i primjenjuje policy pravila, dajući timovima kontrolu nad akcijama agenata poput Claude Code-a.

🟡 🛡️ Sigurnost 20. svibnja 2026. · 2 min čitanja

IBM: Project Glasswing donosi najnapredniji AI-powered security portfolio za enterprise

IBM je predstavio najnapredniji AI-powered security portfolio za enterprise klijente, ojačan radom na Project Glasswingu — industrijskoj koaliciji s Anthropicom koja autonomno detektira i odgovara na AI-napade. Novi IBM Autonomous Security portfolio pokriva cijeli životni ciklus prijetnje.

← Prethodni dan Sljedeći dan →