Srijeda, 22. travnja 2026.

16 vijesti — 🔴 3 kritično , 🟡 7 važno , 🟢 6 zanimljivo

🤖 Modeli (2)

🟢 🤖 Modeli 22. travnja 2026. · 2 min čitanja

MathNet: 30.676 olimpijadnih zadataka iz 47 zemalja, SOTA modeli i dalje zaostaju

Editorial ilustracija: Povezani cvorovi s matematickim simbolima i fragmenti globusa iz 47 zemalja

MIT tim je objavio MathNet, multimodalni benchmark s 30.676 olimpijadnih matematičkih zadataka iz 47 zemalja i 17 jezika. Gemini-3.1-Pro postiže 78,4%, GPT-5 69,3%, a embedding modeli imaju velike poteškoće s pronalaženjem matematički ekvivalentnih problema.

🟢 🤖 Modeli 22. travnja 2026. · 2 min čitanja

xAI Speech-to-Text API izlazi iz beta faze: generalna dostupnost za 25 jezika

Editorial ilustracija: Mikrofon i tokovi zvucnih valova pretvaraju se u transkripte 25 jezika kroz Grok API

xAI je objavio da njegov Speech-to-Text (STT) API prelazi iz beta faze u generalnu dostupnost. Servis podržava 25 jezika, nudi batch i streaming modove te je dostupan bez waitliste — dovršavajući glasovni stack uz ranije GA objavljen Grok Voice Agent.

📦 Open Source (1)

🟢 📦 Open Source 22. travnja 2026. · 2 min čitanja

WorldDB: memorijski engine koji spaja vektorsku bazu i graf svjetova za AI agente

Editorial ilustracija: Vektorska baza podataka i graf cvorova povezani ontologijom u memoriji agenata

WorldDB je novi memorijski engine za AI agente koji kombinira vektorsku bazu s grafom ugniježđenih svjetova i ontologijom. Usklađuje znanje u trenutku pisanja i sprečava kontradikcije u agentnoj memoriji, postižući 96,40% točnosti na LongMemEval-s benchmark-u.

⚖️ Regulacija (1)

🟡 ⚖️ Regulacija 22. travnja 2026. · 3 min čitanja

EU otvara natječaj za AI dezinformacije i deepfake utjecajne kampanje

Editorial ilustracija: Vaga pravde s razbijenim ekranom i robotskom rukom, EU borba protiv AI dezinformacija

Europska komisija otvorila je poziv DIGITAL-2026-BESTUSE-AWARENESS vrijedan 6 milijuna eura za izradu zajedničkog istraživačkog okvira protiv manipulativnog AI sadržaja. Natječaj isporučuje Europski demokratski štit najavljen u studenom 2025. i traži prijave do 1. listopada 2026.

🤝 Agenti (5)

🔴 🤝 Agenti 22. travnja 2026. · 4 min čitanja

Google ReasoningBank: agenti uče iz iskustva bez retraininga, +8,3% uspjeha na WebAreni

Editorial ilustracija: Robot u labirintu s osvijetljenim cvorovima koji predstavljaju nauceno iskustvo

Google je predstavio ReasoningBank, memorijski okvir koji omogućuje AI agentima učenje iz vlastitih uspjeha i neuspjeha bez ponovnog treniranja modela. Na WebArena benchmarku postigao je 8,3% veću stopu uspjeha, a na SWE-Bench-Verified 4,6% uz oko 3 koraka manje po zadatku.

🔴 🤝 Agenti 22. travnja 2026. · 4 min čitanja

OpenAI skalira Codex u enterprise: Codex Labs program i 4 milijuna tjednih aktivnih korisnika

Editorial ilustracija: Futuristicki cityscape s AI entitetom i korporativnim neboderima te kodnim ekranima

OpenAI je pokrenuo Codex Labs program i strateška partnerstva s Accentureom, Deloitteom i KPMG-om kako bi Codex agent doveo u velike tvrtke diljem svijeta. Alat je dosegao 4 milijuna tjednih aktivnih korisnika, nudi certifikacije za konzultante te enterprise pakete s consumption-based modelom naplate.

🟡 🤝 Agenti 22. travnja 2026. · 2 min čitanja

Agent-World: skalabilna sinteza okruženja za evoluciju AI agenata iz Renmin Universityja

Editorial ilustracija: Dinamicka okruzenja s pejzazima i gradovima generirana automatski za ucenje AI agenata

Agent-World je novi istraživački okvir kineskog Renmin Universityja koji automatski generira tisuće raznovrsnih okruženja za treniranje AI agenata. Zamjenjuje ručno izrađene benchmark-e dinamičkim scenarijima i omogućuje evolucijsko učenje kroz koevoluciju agenta i okoline.

🟡 🤝 Agenti 22. travnja 2026. · 3 min čitanja

Gemini Deep Research dobiva MCP integraciju, kolaborativno planiranje i dvije nove verzije

Editorial ilustracija: Robot silueta s modularnim serverima i tokovima podataka za Deep Research agenta

Google je u Gemini API-ju lansirao dvije nove verzije Deep Research agenta — deep-research-preview-04-2026 i deep-research-max-preview-04-2026 — s integracijom MCP servera, kolaborativnim planiranjem, vizualizacijama i streaming odgovorima. Potez pozicionira Gemini kao ozbiljnog konkurenta ChatGPT Deep Researchu i Perplexity Deep Researchu.

🟡 🤝 Agenti 22. travnja 2026. · 2 min čitanja

Multi-Agent Systems survey: od klasičnih paradigmi do budućnosti temeljene na velikim modelima

Editorial ilustracija: Povezani AI agenti u komunikaciji premostuju klasicnu paradigmu s modernom LLM-era

Novi arXiv survey sveobuhvatno premošćuje klasičnu Multi-Agent Systems literaturu s modernim LLM-agent stackom. Rad identificira paradigmatski pomak u koordinaciji, komunikacijskim protokolima i emergentnom ponašanju — od razmjene niskog stanja prema semantičkom rezoniranju.

🔧 Hardware (1)

🔴 🔧 Hardware 22. travnja 2026. · 3 min čitanja

Google predstavio 8. generaciju TPU čipova: dvije specijalizirane varijante za agentic AI eru

Editorial ilustracija: Dva specijalizirana TPU cipa 8. generacije za treniranje i inferenciju agentic AI workloada

Google je na Cloud Next '26 konferenciji predstavio osmu generaciju svojih TPU čipova u dvije specijalizirane varijante — TPU 8t za treniranje modela i TPU 8i za agentic inference. Prva je to generacija posebno dizajnirana za autonomne AI agente i multi-step rezoniranje.

🏥 U praksi (3)

🟡 🏥 U praksi 22. travnja 2026. · 3 min čitanja

Claude Cowork stiže u Amazon Bedrock — AI za cijele organizacije

Editorial ilustracija: Claude Cowork aplikacija na desktopu u AWS Bedrock okruzenju za enterprise timove

AWS i Anthropic omogućuju pokretanje Claude Cowork desktop aplikacije unutar AWS računa preko Amazon Bedrocka. Podaci ostaju pod kontrolom korisnika, model se ne trenira na njima, a integracija s IAM i CloudTrail nudi enterprise razinu audita. Plaćanje ide kroz postojeće AWS ugovore.

🟢 🏥 U praksi 22. travnja 2026. · 2 min čitanja

HolmesGPT i CNCF alati auto-dijagnosticiraju Kubernetes alerte za 0,04 dolara

Editorial ilustracija: Kubernetes nadzorna ploca s alarmima i robotskom rukom za automatsku dijagnozu

STCLab SRE tim koristi HolmesGPT s ReAct obrascem i CNCF alatima za automatsku dijagnozu Kubernetes alertova. Trošak je 0,04 dolara po istrazi, oko 40% alertova rješava se autonomno, a najvažnija lekcija: kvalitetni runbooks važniji su od izbora modela.

🟢 🏥 U praksi 22. travnja 2026. · 2 min čitanja

On-device psihijatrijska AI: Gemma, Phi i Qwen rade bez slanja podataka u cloud

Editorial ilustracija: Mobilni uredaj s psihijatrijskom AI aplikacijom i lokalnim neuronskim mrezama

Istraživači predvođeni Erangom Bandarom objavili su mobilnu aplikaciju koja lokalno orkestrira Gemmu, Phi-3.5-mini i Qwen2 za DSM-5 usklađene psihijatrijske procjene. Sustav ne šalje podatke u cloud, a cilja osjetljive kontekste poput vojske, kaznenog sustava i udaljenog zdravstva.

🛡️ Sigurnost (3)

🟡 🛡️ Sigurnost 22. travnja 2026. · 3 min čitanja

DESPITE benchmark: LLM-ovi dobro planiraju za robote, ali ne i sigurno

Editorial ilustracija: Robot planira put kroz labirint s krhkim digitalnim stitom sigurnosti

Novi DESPITE benchmark evaluirao je 23 jezična modela na 12.279 zadataka planiranja za robote. Rezultat: najbolji planer zakaže u samo 0,4% slučajeva, ali proizvodi opasne planove u 28,3%. Planiranje i sigurnost su ortogonalne sposobnosti — skaliranje modela ne rješava sigurnosne nedostatke.

🟡 🛡️ Sigurnost 22. travnja 2026. · 3 min čitanja

HuggingFace manifesto: open-source kao temelj AI cyber sigurnosti

Editorial ilustracija: Razbijeni digitalni stit popunjen open-source kockom kao temelj AI sigurnosti

HuggingFace je objavio manifest u kojem Margaret Mitchell, Yacine Jernite, Clem Delangue i 17 suautora tvrde da su zatvoreni AI sustavi jedinstvena točka kvara u cyber sigurnosti. Odgovor je na Anthropicov Mythos i poziva na semi-autonomne agente s auditabilnim logovima te ljudskim nadzorom.

🟢 🛡️ Sigurnost 22. travnja 2026. · 2 min čitanja

GitHub CodeQL dobiva deklarativne sanitizatore i validatore, bez pisanja QL koda

Editorial ilustracija: Digitalna tvrdava s bravama za 8 programskih jezika stiti kod od ranjivosti

GitHub je u CodeQL-u 2.25.2 omogućio deklarativno definiranje sanitizatora i validatora kroz YAML, bez pisanja QL koda. Podržano je 8 jezika (C/C++, C#, Go, Java/Kotlin, JS/TS, Python, Ruby, Rust), što demokratizira statičku analizu sigurnosti za timove bez stručnjaka za QL.

← Prethodni dan Sljedeći dan →