🤖 24 AI

Četvrtak, 16. travnja 2026.

17 vijesti — 🔴 2 kritično , 🟡 10 važno , 🟢 5 zanimljivo

← Prethodni dan Sljedeći dan →

🤖 Modeli (2)

📦 Open Source (1)

⚖️ Regulacija (1)

🤝 Agenti (3)

🟡 🤝 Agenti 16. travnja 2026. · 2 min čitanja

OpenAI: Nova generacija Agents SDK-a donosi native sandbox izvršavanje za pouzdane agente

OpenAI je objavio značajnu nadogradnju svog Agents SDK-a koja uvodi native sandbox execution i model-native harness za izgradnju pouzdanijih dugoročnih AI agenata. Novo izdanje fokusirano je na sigurnost izvršavanja koda i autonomiju agenata, omogućujući razvojnim timovima da grade agente koji mogu raditi satima bez ljudskog nadzora uz zadržavanje pouzdanosti.

🟢 🤝 Agenti 16. travnja 2026. · 2 min čitanja

ArXiv: TREX — dva AI agenta automatiziraju cijeli proces fine-tuninga jezičnih modela

TREX je novi višeagentni sustav koji automatizira kompletan pipeline fine-tuninga velikih jezičnih modela — od analize zahtjeva i pretraživanja literature do pripreme podataka i evaluacije rezultata. Sustav modelira eksperimentalni proces kao stablo pretraživanja, a na FT-Bench benchmarku s 10 stvarnih zadataka konzistentno optimizira performanse modela.

🟢 🤝 Agenti 16. travnja 2026. · 2 min čitanja

IBM Research: VAKRA benchmark otkriva da AI agenti padaju na složenom razmišljanju

IBM Research objavio je VAKRA — novi benchmark za evaluaciju AI agenata u enterprise okruženjima koji sadrži više od 8.000 lokalnih API-ja, 62 domene i 4.187 test instanci. Ključni nalaz je da modeli pokazuju površinsku kompetenciju na jednostavnim zadacima, ali padaju na kompozicijskom razmišljanju, multi-hop reasoning degradira s dubinom, a pridržavanje vanjskih ograničenja uzrokuje značajan pad performansi.

🔧 Hardware (2)

🏥 U praksi (2)

💬 Zajednica (1)

🛡️ Sigurnost (5)

🔴 🛡️ Sigurnost 16. travnja 2026. · 2 min čitanja

ArXiv: MemJack — višeagentni napad razbija zaštitu vision-language modela s uspješnošću do 90%

MemJack je novi framework za jailbreak napade na vision-language modele (VLM) koji koristi koordiniranu suradnju više agenata umjesto klasičnih pikselnih perturbacija. Testiranjem na nemodificiranim COCO slikama postiže 71,48% uspješnosti na Qwen3-VL-Plus, a s proširenim budžetom do 90%. Istraživači najavljuju javno objavljivanje 113.000+ interaktivnih trajektorija za obrambena istraživanja.

🔴 🛡️ Sigurnost 16. travnja 2026. · 3 min čitanja

OpenAI: Program Trusted Access for Cyber donosi $10 milijuna za globalnu kibernetičku obranu

OpenAI je pokrenuo inicijativu Trusted Access for Cyber koja okuplja vodeće sigurnosne organizacije i enterprise korisnike oko specijaliziranog modela GPT-5.4-Cyber. Program uključuje $10 milijuna u API grantovima namijenjenim jačanju globalne kibernetičke obrane, čime OpenAI pozicionira AI kao aktivnog igrača u sigurnosnom ekosustavu.

🟡 🛡️ Sigurnost 16. travnja 2026. · 2 min čitanja

EleutherAI: Nova metoda otkriva reward hacking prije nego postane vidljiv

EleutherAI je objavio istraživanje o metodi 'reasoning interpolation' koja otkriva rane znakove reward hackinga u reinforcement learning sustavima. Tehnika koristi importance sampling i fine-tunirane donor modele za predviđanje budućih exploit obrazaca s AUC od 1.00, dok standardne metode podcijeniju stope exploita za 2-5 redova veličine.

🟡 🛡️ Sigurnost 16. travnja 2026. · 2 min čitanja

ArXiv: MCPThreatHive — prva automatizirana platforma za sigurnost MCP ekosustava

MCPThreatHive je nova open-source platforma koja automatizira cijeli životni ciklus threat intelligence-a za Model Context Protocol ekosustave. Platforma operacionalizira MCP-38 taksonomiju s 38 specifičnih obrazaca prijetnji, mapira ih na STRIDE i OWASP okvire te uključuje sustav za kvantitativno rangiranje rizika. Predstavljena je na DEFCON SG 2026.

🟡 🛡️ Sigurnost 16. travnja 2026. · 2 min čitanja

ArXiv: RePAIR omogućuje LLM-ovima da 'zaborave' ciljane informacije bez ponovnog treninga

RePAIR je novi framework za interaktivno strojno zaboravljanje (machine unlearning) koji omogućuje korisnicima da putem natural language promptova naredbe velikim jezičnim modelima da zaborave specifične informacije u stvarnom vremenu. Ključna inovacija STAMP metoda preusmjerava MLP aktivacije prema refusal subprostoru zatvorenom formulom, bez potrebe za ponovnim treniranjem modela, postižući gotovo nulte rezultate zaboravljanja uz očuvanje korisnosti modela.

← Prethodni dan Sljedeći dan →