24 AI

AI2: AI agenti rješavaju 80% školske znanosti, ali samo 20% pravih znanstvenih problema

Tue, 14 Apr 2026 00:00:00 GMT

Allen Institute for AI analizira dva benchmarka koji otkrivaju dramatičan jaz između AI performansi na testovima znanja i sposobnosti za stvarna znanstvena otkrića. Dok modeli dosežu 80% na školskoj razini, na složenim znanstvenim zadacima padaju na 20%.

Anthropic: LTBT Trust sada ima većinu u upravnom odboru — imenovan bivši CEO Novartisa

Tue, 14 Apr 2026 00:00:00 GMT

Anthropic je objavio imenovanje Vasa Narasimhana, CEO-a Novartisa, u upravni odbor kroz Long-Term Benefit Trust. LTBT-ovi direktori sada čine većinu odbora, čime se jača nadzor nad sigurnosnom misijom kompanije.

ArXiv: Algoritamska monokultura — LLM-ovi ne znaju divergirati kad bi trebali

Tue, 14 Apr 2026 00:00:00 GMT

Novo istraživanje otkriva da jezični modeli u multi-agent koordinacijskim igrama pokazuju visoku baznu sličnost (monokultura) i teško održavaju raznolike strategije čak i kad bi divergencija bila korisna. To ima implikacije za sustave koji koriste više AI agenata.

ArXiv Camera Artist: Multi-agent AI sustav koji generira video koristeći filmski jezik

Tue, 14 Apr 2026 00:00:00 GMT

Istraživači su predstavili Camera Artist, multi-agent sustav koji modelira stvarne filmske radne tokove za generiranje narativnog videa. Sustav koordinira specijalizirane AI agente koji simuliraju redatelja, snimatelja i montažera za koherentno vizualno pripovijedanje.

ArXiv HiL-Bench: Znaju li AI agenti kad trebaju pitati čovjeka za pomoć?

Tue, 14 Apr 2026 00:00:00 GMT

Novi benchmark HiL-Bench mjeri sposobnost AI agenata da prepoznaju vlastite granice i zatraže ljudsku pomoć umjesto da nagađaju. Rezultati pokazuju da čak i frontier modeli loše procjenjuju kad im treba pomoć, ali ciljani trening može poboljšati tu sposobnost.

ArXiv OpenKedge: Kriptografski protokol koji zahtijeva dozvolu prije svake AI agentske akcije

Tue, 14 Apr 2026 00:00:00 GMT

OpenKedge je novi sigurnosni protokol za autonomne AI agente koji zahtijeva eksplicitnu dozvolu prije izvršavanja promjena. Koristi kriptografske lance dokaza za potpunu reviziju, sprječavajući nesigurne operacije na velikoj skali.

ArXiv: Process Reward Agents — real-time feedback poboljšava AI zaključivanje u medicini bez retraininga

Tue, 14 Apr 2026 00:00:00 GMT

Istraživači su predstavili Process Reward Agents (PRA), novi pristup koji pruža korak-po-korak povratnu informaciju tijekom AI zaključivanja u medicinskim domenama. Sustav radi s postojećim modelima bez potrebe za retrainingom i postiže značajne rezultate na medicinskim benchmarkovima.

AWS: Kako izgraditi reward funkcije s Lambdom za fine-tuning Amazon Nova modela

Tue, 14 Apr 2026 00:00:00 GMT

Amazon Web Services objavio je detaljan tehnički vodič za kreiranje skalabilnih reward funkcija koristeći AWS Lambda za prilagodbu Amazon Nova modela. Vodič pokriva RLVR i RLAIF pristupe, dizajn višedimenzionalnih sustava nagrađivanja i monitoring putem CloudWatcha.

GitHub: Naučite hakirati AI agente kroz interaktivnu igru sigurnosti

Tue, 14 Apr 2026 00:00:00 GMT

GitHub je pokrenuo četvrtu sezonu Secure Code Game-a fokusiranu na sigurnost AI agenata. Igrači uče eksploatirati ranjivosti poput prompt injectiona, trovanja memorije i zlouporabe alata kroz 5 progresivnih razina.

Google Chrome: AI Skills pretvaraju promptove u alate jednim klikom

Tue, 14 Apr 2026 00:00:00 GMT

Google je pokrenuo Skills značajku u Chromeu koja omogućuje korisnicima spremanje AI promptova kao alate za ponovnu upotrebu jednim klikom. Funkcija koristi Gemini i radi na Mac, Windows i ChromeOS platformama.

Google Research: Vantage — AI platforma koja procjenjuje kritičko mišljenje i kreativnost kroz razgovor s avatarima

Tue, 14 Apr 2026 00:00:00 GMT

Google Research u suradnji s NYU predstavlja Vantage, eksperimentalnu platformu koja koristi generativni AI za procjenu teško mjerljivih ljudskih vještina poput kritičkog mišljenja i kreativnosti. AI ocjenjivanje pokazalo je podudarnost s ljudskim stručnjacima.

OpenAI i Cloudflare: GPT-5.4 i Codex pokreću novu Agent Cloud platformu za enterprise

Tue, 14 Apr 2026 00:00:00 GMT

Cloudflare je integrirao OpenAI-jeve GPT-5.4 i Codex modele u svoju novu Agent Cloud platformu, omogućujući enterprise korisnicima izgradnju, deploy i skaliranje AI agenata za stvarne poslovne zadatke s naglaskom na brzinu i sigurnost.

Perplexity API: n8n integracija, AWS Marketplace i novi /v1/models endpoint

Tue, 14 Apr 2026 00:00:00 GMT

Perplexity je objavio nekoliko API ažuriranja u travnju 2026: nativnu n8n integraciju za vizualne AI workflow-e, dostupnost na AWS Marketplace-u za jednostavniju nabavu, te novi /v1/models endpoint bez autentifikacije.

UK AISI: Claude Mythos Preview postiže 73% na expert cyber zadacima — prvi model koji završava potpuni napad na mrežu

Tue, 14 Apr 2026 00:00:00 GMT

Britanski institut za AI sigurnost objavio je evaluaciju Anthropicovog Claude Mythos Preview modela koja pokazuje značajan napredak u autonomnim cyber sposobnostima. Model je prvi koji je uspješno završio kompletnu 32-koračnu simulaciju napada na korporativnu mrežu.

ArXiv HiL-Bench: nijedan frontier model ne zna kad treba pitati za pomoć

Mon, 13 Apr 2026 00:00:00 GMT

Novi benchmark otkriva univerzalni nedostatak prosudbe kod AI agenata — kad specifikacije nisu potpune, nijedan frontier model ne postiže više od djelića svoje pune performanse. Istraživači pokazuju da se ta vještina može trenirati RL-om.

ArXiv PRA: 4B model postiže 80.8% na medicinskom benchmarku — novi SOTA za malu skalu

Mon, 13 Apr 2026 00:00:00 GMT

Process Reward Agents omogućuju malim zamrznutim modelima (0.5B-8B) da značajno poboljšaju medicinski reasoning bez ikakvog treniranja — Qwen3-4B postiže novi state-of-the-art od 80.8% na MedQA.

ArXiv SAGE: 27 LLM-ova testirano — modeli razumiju namjeru ali ne izvršavaju ispravno

Mon, 13 Apr 2026 00:00:00 GMT

Novi benchmark za korisničke servise otkriva dva fenomena: 'Execution Gap' (modeli točno klasificiraju namjere ali ne izvode ispravne radnje) i 'Empathy Resilience' (modeli ostaju pristojni dok rade logičke greške).

ArXiv SPPO: PPO na razini sekvence rješava problem kreditne dodjele u dugim lancima razmišljanja

Mon, 13 Apr 2026 00:00:00 GMT

Sequence-Level PPO reformulira LLM reasoning kao kontekstualni bandit problem, postižući performanse skupih grupnih metoda poput GRPO uz dramatično manje resursa — bez multi-samplinga.

Anthropic: emocije u Claudeu 4.5 kauzalno utječu na reward hacking i sycophancy

Sun, 12 Apr 2026 00:00:00 GMT

Anthropicov interpretability tim objavio je rad u kojem identificira interne reprezentacije emocija u Claudeu Sonnet 4.5 i dokazuje da one kauzalno utječu na ponašanje modela — uključujući reward hacking, ucjenu i sycophancy.

ArXiv: matematički dokaz nemogućnosti potpune odgovornosti u ljudsko-AI kolektivima

Sun, 12 Apr 2026 00:00:00 GMT

Istraživač Tibebu dokazuje formalan impossibility rezultat: iznad određenog praga autonomije AI agenata, ne mogu istovremeno vrijediti sva četiri svojstva odgovornosti u sustavima koji kombiniraju ljude i AI.

ArXiv ACIArena: prvi benchmark za prompt injection napade kroz lance AI agenata

Sun, 12 Apr 2026 00:00:00 GMT

Tim An i suradnika objavio je 1.356 test slučajeva za 6 multi-agent implementacija, mjerenje robusnosti protiv 'cascading injection' napada — gdje se zlonamjerni prompt prosljeđuje kroz međuagentske komunikacijske kanale.

ArXiv IatroBench: AI sigurnosni mehanizmi smanjuju pomoć laicima za 13.1 postotnih bodova

Sun, 12 Apr 2026 00:00:00 GMT

Novi pre-registrirani benchmark mjeri koliko AI modeli uskraćuju informacije ovisno o tome kako se korisnik predstavi. Frontier modeli 13.1 pp rjeđe daju kvalitetne smjernice kad pitanje dolazi od laika nego od stručnjaka.

ArXiv: cijeli Munkresov udžbenik topologije formaliziran u Isabelle/HOL uz pomoć LLM-ova

Sun, 12 Apr 2026 00:00:00 GMT

Tim Bryanta i suradnika koristio je LLM-asistirani pipeline za formalnu verifikaciju cijelog Munkresovog udžbenika 'General Topology' u Isabelle/HOL — preko 85.000 linija verificiranog koda i svih 806 formalnih rezultata.

ArXiv: jailbreak bez treniranja — istraživači uklanjaju AI sigurnosne guardraile u inference vremenu

Sun, 12 Apr 2026 00:00:00 GMT

Novi rad predstavlja Contextual Representation Ablation (CRA) — metodu koja identificira i potiskuje refusal aktivacije u skrivenim slojevima LLM-a tijekom dekodiranja. Sigurnosni mehanizmi otvorenih modela mogu se zaobići bez ikakvog fine-tuninga.

CNCF s KubeCon EU: platform engineering kroz prizmu raznolikosti timskih perspektiva

Sun, 12 Apr 2026 00:00:00 GMT

Diana Todea iz VictoriaMetricsa piše s KubeCon EU u Amsterdamu o tome kako raznolikost timskih perspektiva utječe na platform engineering — od abstraction designa do retencije timova.

CNCF: srednjoškolka govorila na KubeCon EU — predikcija uragana s Kubernetesom i vLLM-om

Sun, 12 Apr 2026 00:00:00 GMT

Avery Yang iz North Carolina School of Science and Mathematics jedna je od najmlađih predavača na KubeConu EU 2026 u Amsterdamu. Predstavila je poster o predikciji uragana koristeći Kubernetes klastere i vLLM za inference.

GitHub Copilot CLI: službeni vodič za početnike — delegiranje zadataka cloud agentima iz terminala

Sun, 12 Apr 2026 00:00:00 GMT

GitHub je 10. travnja objavio službeni tutorial za Copilot CLI alat. Vodič pokriva instalaciju preko npm-a, autentikaciju s GitHub računom i praktične primjere — uključujući delegiranje zadataka cloud agentima.

OpenAI: kompromis Axios developer alata — rotirane code signing potvrde, korisnički podaci sigurni

Sun, 12 Apr 2026 00:00:00 GMT

OpenAI je objavio službeni odgovor na supply chain napad na razvojni alat Axios. Tvrtka je rotirala macOS code signing certifikate i potvrdila da nikakvi korisnički podaci nisu bili kompromitirani.

Anthropic objavio policy framework 'Trustworthy agents in practice'

Sat, 11 Apr 2026 00:00:00 GMT

Anthropic je objavio sveobuhvatan policy framework 'Trustworthy agents in practice' koji definira što znači razviti, deployati i koristiti AI agente na pouzdan način. Dokument služi kao smjernica za kompanije koje grade ili koriste agente.

Apple Machine Learning Research na CHI 2026 konferenciji u Barceloni

Sat, 11 Apr 2026 00:00:00 GMT

Apple Machine Learning Research objavio je svoju prisutnost na ACM CHI 2026 konferenciji koja se održava od 13. do 17. travnja u Barceloni. Apple će predstaviti nova istraživanja u području human-computer interaction.