Četvrtak, 16. travnja 2026.

17 vijesti — 🔴 2 kritično , 🟡 10 važno , 🟢 5 zanimljivo

🤖 Modeli (2)

🟡 🤖 Modeli 16. travnja 2026. · 2 min čitanja

Google: Gemini 3.1 Flash TTS donosi ekspresivni AI govor na više od 70 jezika

Google je lansirao Gemini 3.1 Flash TTS, novi text-to-speech model koji podržava više od 70 jezika i postiže Elo rezultat od 1.211 na ljestvici Artificial Analysis. Ključna inovacija su audio tagovi — ugrađivanje natural language komandi direktno u tekst za preciznu kontrolu glasa, intonacije i emocija. Model je dostupan na Google AI Studio, Vertex AI i Google Vids, uz SynthID watermarking za detekciju AI-generiranog zvuka.

🟢 🤖 Modeli 16. travnja 2026. · 2 min čitanja

ArXiv: Numerička nestabilnost u LLM-ovima — kako floating-point greške stvaraju kaos u transformerima

Novo istraživanje rigorozno analizira kako greške zaokruživanja u floating-point aritmetici propagiraju kaos kroz slojeve transformer arhitekture. Rad identificira tri režima ponašanja — stabilni, kaotični i signal-dominirani — te dokazuje da numerička nestabilnost nije bug nego fundamentalno svojstvo LLM-ova koje ugrožava reproducibilnost u produkcijskim sustavima.

📦 Open Source (1)

🟢 📦 Open Source 16. travnja 2026. · 2 min čitanja

LangChain: Kako smo natjerali dokumentaciju da testira samu sebe pomoću Deep Agenata

LangChain je izgradio automatizirani sustav za testiranje dokumentacije korištenjem Deep Agenata koji sprječava zastarjele primjere koda u dokumentaciji. Sustav koristi višestruke vještine (skills) koje migriraju inline kodne isječke u samostalne test datoteke, pokreću ih kroz GitHub Actions i regeneriraju verificirane isječke, osiguravajući da dokumentacija uvijek odražava stvarno stanje API-ja.

⚖️ Regulacija (1)

🟡 ⚖️ Regulacija 16. travnja 2026. · 2 min čitanja

ArXiv: Katalog 195 AI safety benchmarka otkriva fragmentaciju i slabe standarde mjerenja

AISafetyBenchExplorer je strukturirani katalog koji dokumentira 195 AI safety benchmarka objavljenih između 2018. i 2026. godine. Istraživanje otkriva alarmantnu fragmentaciju u polju — pojmovi poput 'accuracy' i 'safety score' skrivaju potpuno različite metodologije. Od 195 benchmarka, čak 165 evaluira samo engleski jezik, a 137 ima neaktivne GitHub repozitorije, ukazujući na nedostatak održavanja nakon objave.

🤝 Agenti (3)

🟡 🤝 Agenti 16. travnja 2026. · 2 min čitanja

OpenAI: Nova generacija Agents SDK-a donosi native sandbox izvršavanje za pouzdane agente

OpenAI je objavio značajnu nadogradnju svog Agents SDK-a koja uvodi native sandbox execution i model-native harness za izgradnju pouzdanijih dugoročnih AI agenata. Novo izdanje fokusirano je na sigurnost izvršavanja koda i autonomiju agenata, omogućujući razvojnim timovima da grade agente koji mogu raditi satima bez ljudskog nadzora uz zadržavanje pouzdanosti.

🟢 🤝 Agenti 16. travnja 2026. · 2 min čitanja

ArXiv: TREX — dva AI agenta automatiziraju cijeli proces fine-tuninga jezičnih modela

TREX je novi višeagentni sustav koji automatizira kompletan pipeline fine-tuninga velikih jezičnih modela — od analize zahtjeva i pretraživanja literature do pripreme podataka i evaluacije rezultata. Sustav modelira eksperimentalni proces kao stablo pretraživanja, a na FT-Bench benchmarku s 10 stvarnih zadataka konzistentno optimizira performanse modela.

🟢 🤝 Agenti 16. travnja 2026. · 2 min čitanja

IBM Research: VAKRA benchmark otkriva da AI agenti padaju na složenom razmišljanju

IBM Research objavio je VAKRA — novi benchmark za evaluaciju AI agenata u enterprise okruženjima koji sadrži više od 8.000 lokalnih API-ja, 62 domene i 4.187 test instanci. Ključni nalaz je da modeli pokazuju površinsku kompetenciju na jednostavnim zadacima, ali padaju na kompozicijskom razmišljanju, multi-hop reasoning degradira s dubinom, a pridržavanje vanjskih ograničenja uzrokuje značajan pad performansi.

🔧 Hardware (2)

🟡 🔧 Hardware 16. travnja 2026. · 2 min čitanja

AWS: Speculative decoding na Trainium čipovima ubrzava LLM inference do 3 puta

Amazon Web Services objavio je detaljnu implementaciju speculative decodinga na AWS Trainium čipovima u kombinaciji s vLLM frameworkom, postižući do 3 puta brže generiranje tokena za decode-heavy radne zadatke. Tehnika koristi manji draft model koji predviđa sljedećih N tokena, a veći target model ih verificira u jednom prolazu, eliminirajući usko grlo sekvencijalnog generiranja.

🟢 🔧 Hardware 16. travnja 2026. · 2 min čitanja

NVIDIA: Blackwell generira tokene 35 puta jeftinije od Hoppera — cijena po tokenu jedina je metrika

NVIDIA je objavila analizu koja argumentira da je cijena po tokenu jedina relevantna metrika za AI infrastrukturu. Usporedba Blackwell i Hopper generacije pokazuje da Blackwell košta dva puta više po GPU satu, ali generira 65 puta više tokena u sekundi, rezultirajući 35 puta nižom cijenom po milijunu tokena — 0,12 dolara nasuprot 4,20 dolara za Hopper.

🏥 U praksi (2)

🟡 🏥 U praksi 16. travnja 2026. · 2 min čitanja

GitHub: Copilot Cloud Agent sada se može selektivno aktivirati po organizaciji

GitHub je omogućio enterprise administratorima da selektivno aktiviraju pristup Copilot cloud agentu putem custom properties umjesto dosadašnjeg sve-ili-ništa pristupa. Nova značajka donosi granularniju kontrolu nad AI agentnim mogućnostima na razini pojedinačnih organizacija, uz nove API endpointe i upravljanje putem AI Controls sučelja unutar GitHub Enterprise postavki.

🟡 🏥 U praksi 16. travnja 2026. · 2 min čitanja

Microsoft: Frontier Transformation — kako UBS, BMW i zdravstvo prelaze s AI eksperimenata na jezgru poslovanja

Microsoft je objavio koncept Frontier Transformation koji opisuje prijelaz industrija s AI eksperimenata na integraciju u temeljne poslovne operacije. Studije slučaja uključuju UBS za pravna istraživanja, BMW za multi-agentnu analitiku vozila, Cooper Health Care za smanjenje burnout-a kliničara i Venchi za personalizaciju maloprodaje.

💬 Zajednica (1)

🟡 💬 Zajednica 16. travnja 2026. · 2 min čitanja

ArXiv: AAAI-26 proveo AI recenzije na 22.977 radova — recenzenti ih ocijenili bolje od ljudskih

AAAI-26 je provela prvi eksperiment AI-asistiranih recenzija na konferencijskoj skali — svih 22.977 prijavljenih radova dobilo je jednu jasno označenu AI-generiranu recenziju uz ljudske. Članovi programskog odbora ocijenili su AI recenzije višom ocjenom od ljudskih za tehničku točnost i istraživačke prijedloge.

🛡️ Sigurnost (5)

🔴 🛡️ Sigurnost 16. travnja 2026. · 2 min čitanja

ArXiv: MemJack — višeagentni napad razbija zaštitu vision-language modela s uspješnošću do 90%

MemJack je novi framework za jailbreak napade na vision-language modele (VLM) koji koristi koordiniranu suradnju više agenata umjesto klasičnih pikselnih perturbacija. Testiranjem na nemodificiranim COCO slikama postiže 71,48% uspješnosti na Qwen3-VL-Plus, a s proširenim budžetom do 90%. Istraživači najavljuju javno objavljivanje 113.000+ interaktivnih trajektorija za obrambena istraživanja.

🔴 🛡️ Sigurnost 16. travnja 2026. · 3 min čitanja

OpenAI: Program Trusted Access for Cyber donosi $10 milijuna za globalnu kibernetičku obranu

OpenAI je pokrenuo inicijativu Trusted Access for Cyber koja okuplja vodeće sigurnosne organizacije i enterprise korisnike oko specijaliziranog modela GPT-5.4-Cyber. Program uključuje $10 milijuna u API grantovima namijenjenim jačanju globalne kibernetičke obrane, čime OpenAI pozicionira AI kao aktivnog igrača u sigurnosnom ekosustavu.

🟡 🛡️ Sigurnost 16. travnja 2026. · 2 min čitanja

EleutherAI: Nova metoda otkriva reward hacking prije nego postane vidljiv

EleutherAI je objavio istraživanje o metodi 'reasoning interpolation' koja otkriva rane znakove reward hackinga u reinforcement learning sustavima. Tehnika koristi importance sampling i fine-tunirane donor modele za predviđanje budućih exploit obrazaca s AUC od 1.00, dok standardne metode podcijeniju stope exploita za 2-5 redova veličine.

🟡 🛡️ Sigurnost 16. travnja 2026. · 2 min čitanja

ArXiv: MCPThreatHive — prva automatizirana platforma za sigurnost MCP ekosustava

MCPThreatHive je nova open-source platforma koja automatizira cijeli životni ciklus threat intelligence-a za Model Context Protocol ekosustave. Platforma operacionalizira MCP-38 taksonomiju s 38 specifičnih obrazaca prijetnji, mapira ih na STRIDE i OWASP okvire te uključuje sustav za kvantitativno rangiranje rizika. Predstavljena je na DEFCON SG 2026.

🟡 🛡️ Sigurnost 16. travnja 2026. · 2 min čitanja

ArXiv: RePAIR omogućuje LLM-ovima da 'zaborave' ciljane informacije bez ponovnog treninga

RePAIR je novi framework za interaktivno strojno zaboravljanje (machine unlearning) koji omogućuje korisnicima da putem natural language promptova naredbe velikim jezičnim modelima da zaborave specifične informacije u stvarnom vremenu. Ključna inovacija STAMP metoda preusmjerava MLP aktivacije prema refusal subprostoru zatvorenom formulom, bez potrebe za ponovnim treniranjem modela, postižući gotovo nulte rezultate zaboravljanja uz očuvanje korisnosti modela.

← Prethodni dan Sljedeći dan →