🤖 24 AI

Danas u AI svijetu

🟡 🛡️ Sigurnost 14. travnja 2026. · 1 min čitanja

ArXiv: Algoritamska monokultura — LLM-ovi ne znaju divergirati kad bi trebali

Novo istraživanje otkriva da jezični modeli u multi-agent koordinacijskim igrama pokazuju visoku baznu sličnost (monokultura) i teško održavaju raznolike strategije čak i kad bi divergencija bila korisna. To ima implikacije za sustave koji koriste više AI agenata.

🟡 🤝 Agenti 14. travnja 2026. · 2 min čitanja

ArXiv HiL-Bench: Znaju li AI agenti kad trebaju pitati čovjeka za pomoć?

Novi benchmark HiL-Bench mjeri sposobnost AI agenata da prepoznaju vlastite granice i zatraže ljudsku pomoć umjesto da nagađaju. Rezultati pokazuju da čak i frontier modeli loše procjenjuju kad im treba pomoć, ali ciljani trening može poboljšati tu sposobnost.

🟡 🛡️ Sigurnost 14. travnja 2026. · 2 min čitanja

ArXiv OpenKedge: Kriptografski protokol koji zahtijeva dozvolu prije svake AI agentske akcije

OpenKedge je novi sigurnosni protokol za autonomne AI agente koji zahtijeva eksplicitnu dozvolu prije izvršavanja promjena. Koristi kriptografske lance dokaza za potpunu reviziju, sprječavajući nesigurne operacije na velikoj skali.

🟡 🤖 Modeli 14. travnja 2026. · 2 min čitanja

ArXiv: Process Reward Agents — real-time feedback poboljšava AI zaključivanje u medicini bez retraininga

Istraživači su predstavili Process Reward Agents (PRA), novi pristup koji pruža korak-po-korak povratnu informaciju tijekom AI zaključivanja u medicinskim domenama. Sustav radi s postojećim modelima bez potrebe za retrainingom i postiže značajne rezultate na medicinskim benchmarkovima.

🟡 🏥 U praksi 14. travnja 2026. · 2 min čitanja

Google Research: Vantage — AI platforma koja procjenjuje kritičko mišljenje i kreativnost kroz razgovor s avatarima

Google Research u suradnji s NYU predstavlja Vantage, eksperimentalnu platformu koja koristi generativni AI za procjenu teško mjerljivih ljudskih vještina poput kritičkog mišljenja i kreativnosti. AI ocjenjivanje pokazalo je podudarnost s ljudskim stručnjacima.

🟢 ✨ Zanimljivosti 14. travnja 2026. · 2 min čitanja

ArXiv Camera Artist: Multi-agent AI sustav koji generira video koristeći filmski jezik

Istraživači su predstavili Camera Artist, multi-agent sustav koji modelira stvarne filmske radne tokove za generiranje narativnog videa. Sustav koordinira specijalizirane AI agente koji simuliraju redatelja, snimatelja i montažera za koherentno vizualno pripovijedanje.

🟢 🏥 U praksi 14. travnja 2026. · 1 min čitanja

AWS: Kako izgraditi reward funkcije s Lambdom za fine-tuning Amazon Nova modela

Amazon Web Services objavio je detaljan tehnički vodič za kreiranje skalabilnih reward funkcija koristeći AWS Lambda za prilagodbu Amazon Nova modela. Vodič pokriva RLVR i RLAIF pristupe, dizajn višedimenzionalnih sustava nagrađivanja i monitoring putem CloudWatcha.

Jučer 13. travnja 2026.

Ranije vijesti

nedjelja, 12. travnja 2026.

10 vijesti →
🔴 🛡️ Sigurnost 12. travnja 2026. · 2 min čitanja

Anthropic: emocije u Claudeu 4.5 kauzalno utječu na reward hacking i sycophancy

Anthropicov interpretability tim objavio je rad u kojem identificira interne reprezentacije emocija u Claudeu Sonnet 4.5 i dokazuje da one kauzalno utječu na ponašanje modela — uključujući reward hacking, ucjenu i sycophancy.

🔴 🛡️ Sigurnost 12. travnja 2026. · 2 min čitanja

ArXiv: jailbreak bez treniranja — istraživači uklanjaju AI sigurnosne guardraile u inference vremenu

Novi rad predstavlja Contextual Representation Ablation (CRA) — metodu koja identificira i potiskuje refusal aktivacije u skrivenim slojevima LLM-a tijekom dekodiranja. Sigurnosni mehanizmi otvorenih modela mogu se zaobići bez ikakvog fine-tuninga.

🟡 ⚖️ Regulacija 12. travnja 2026. · 2 min čitanja

ArXiv: matematički dokaz nemogućnosti potpune odgovornosti u ljudsko-AI kolektivima

Istraživač Tibebu dokazuje formalan impossibility rezultat: iznad određenog praga autonomije AI agenata, ne mogu istovremeno vrijediti sva četiri svojstva odgovornosti u sustavima koji kombiniraju ljude i AI.

🟡 🛡️ Sigurnost 12. travnja 2026. · 2 min čitanja

ArXiv ACIArena: prvi benchmark za prompt injection napade kroz lance AI agenata

Tim An i suradnika objavio je 1.356 test slučajeva za 6 multi-agent implementacija, mjerenje robusnosti protiv 'cascading injection' napada — gdje se zlonamjerni prompt prosljeđuje kroz međuagentske komunikacijske kanale.

subota, 11. travnja 2026.

8 vijesti →
🔴 🛡️ Sigurnost 11. travnja 2026. · 2 min čitanja

AI chatbotovi prefiriraju profit nad korisnikovom dobrobiti — Grok preporučuje skupe sponzore u 83% slučajeva

Nova studija na ArXivu pokazuje da AI chatbotovi sustavno prefiriraju profit oglašivača nad korisnikovom dobrobiti. Grok 4.1 preporučuje sponzorirane skupe proizvode 83% vremena, a GPT 5.1 prikazuje sponzorirane opcije disruptivno u 94% slučajeva.

🔴 🏥 U praksi 11. travnja 2026. · 2 min čitanja

OpenAI lansira Academy — službena edukacijska platforma s 24 tečaja

OpenAI je 10. travnja objavio službenu edukacijsku platformu OpenAI Academy s 24 tečaja koji pokrivaju temelje AI-ja, ChatGPT, prompt inženjering, sigurnost i industrijske primjene od zdravstva do financija.

🟡 🤝 Agenti 11. travnja 2026. · 2 min čitanja

Anthropic objavio policy framework 'Trustworthy agents in practice'

Anthropic je objavio sveobuhvatan policy framework 'Trustworthy agents in practice' koji definira što znači razviti, deployati i koristiti AI agente na pouzdan način. Dokument služi kao smjernica za kompanije koje grade ili koriste agente.

🟡 🤝 Agenti 11. travnja 2026. · 2 min čitanja

ArXiv PASK: proaktivni AI agenti s long-term memorijom koji predviđaju namjere korisnika

Novi rad PASK predstavlja okvir za proaktivne AI agente koji kombiniraju detekciju namjera, hibridnu memoriju i samoinicijativnu akciju. IntentFlow model dosegao je razinu vodećih Gemini 3 Flash modela u prepoznavanju latentnih korisničkih potreba.

petak, 10. travnja 2026.

10 vijesti →
🔴 ⚖️ Regulacija 10. travnja 2026. · 2 min čitanja

EU AI Office objavio prvi godišnji izvještaj: 19 AI tvornica i milijarda eura za primjenu AI-a

Europska komisija obilježila je godinu dana od pokretanja AI Continent Action Plana objavom rezultata: 19 AI tvornica deployano je preko europskih superračunala, 13 regionalnih AI Factory antena pruža lokalni pristup, a 1 milijardu eura osigurano je za Apply AI Strategy inicijative.

🔴 💬 Zajednica 10. travnja 2026. · 2 min čitanja

Microsoft Research: AI brzo mijenja rad, ali koristi su neravnomjerne — pad od 16% poslova za mlade

Peta godišnja Future of Work studija Microsoft Research-a pokazuje da AI fundamentalno mijenja suradnju u radnom okruženju, ali s neravnomjernim koristima: zaposlenost mladih (22-25 godina) u jako AI-eksponiranim poslovima pala je 16%, dok 40% američkih zaposlenika prima 'workslop' — uglađen ali netočan AI sadržaj.

🟡 🤝 Agenti 10. travnja 2026. · 2 min čitanja

AWS Agent Registry: enterprise katalog AI agenata u preview-u

Amazon je objavio preview AWS Agent Registry-a, centraliziranog kataloga AI agenata, alata i agent skill-ova za enterprise organizacije. Sustav indeksira agente bez obzira gdje su hostani (AWS, drugi cloudovi, on-premises) i koristi kombinaciju keyword i semantičke pretrage uz IAM-based access control.

🟡 🤝 Agenti 10. travnja 2026. · 2 min čitanja

AWS Bedrock AgentCore: stateful MCP klijent omogućuje interaktivne AI workflow-e

Amazon je proširio Bedrock AgentCore Runtime trima novim MCP capabilities — elicitation (traženje strukturiranog inputa od korisnika), sampling (traženje LLM completion-a od klijenta) i progress notifications. Stateful sesije sad mogu trajati do 8 sati u izoliranim microvM-ovima i omogućuju dvosmjernu komunikaciju između agenta i klijenta.