Petak, 22. svibnja 2026.

12 vijesti — 🔴 2 kritično , 🟡 8 važno , 🟢 2 zanimljivo

🤖 Modeli (2)

🟡 🤖 Modeli 22. svibnja 2026. · 3 min čitanja

arXiv:2605.21006: Off-the-shelf persona vektori postižu 68-98% učinkovitosti targetiranog sycophancy steeringa u LLM modelima

Editorial illustration: 2605.21006: Off-the-shelf persona vektori postižu 68-98% učinkovitosti targetiranog sycophancy steeringa u LLM mode

Istraživači su 21. svibnja 2026. na arXivu objavili rad pod nazivom 'Playing Devil's Advocate' koji pokazuje da postojeći persona vektori razvijeni za roleplay zadatke mogu reducirati sycophancy (sklonost modela slaganju s korisnikom čak i kad griješi) na 68-98% učinkovitosti specijaliziranog Contrastive Activation Addition (CAA) pristupa — bez treniranja na sycophancy-specifičnim podacima. Geometrijska analiza otkriva da je sycophancy svojstvo na razini persone, a ne jedan vodljiv smjer u aktivacijskom prostoru, što otvara puno lakše puteve za alignment.

🟢 🤖 Modeli 22. svibnja 2026. · 3 min čitanja

Black Forest Labs: FLUX Erase nadmašuje GPT Image-2 (68.5%) i Finegrain (63.2%) u uklanjanju objekata bez prompta

Editorial illustration: FLUX Erase nadmašuje GPT Image-2 (68.5%) i Finegrain (63.2%) u uklanjanju objekata bez prompta

Black Forest Labs je 21. svibnja 2026. lansirao FLUX Erase — inpainting alat koji uz binarnu masku uklanja objekte, sjene, vodene žigove i tekstove iz slika i rekonstruira pozadinu bez ikakvog tekstualnog prompta. Benchmark na 198 testnih slika pokazuje nadmoć nad GPT Image-2 (68.5%) i Finegrain Eraser Standard (63.2%). Alat je dostupan kroz BFL API i javni demo na flux-tools.bfl.ai/erase, pozicionirajući BFL kao specijalista za professional creative workflow alate.

⚖️ Regulacija (1)

🔴 ⚖️ Regulacija 22. svibnja 2026. · 3 min čitanja

UK AI Safety Institute: Nadzor nad naprednim AI sustavima postaje sve teži — 20+ putanja degradacije identificirano

Editorial illustration: Nadzor nad naprednim AI sustavima postaje sve teži — 20+ putanja degradacije identificirano

UK AI Safety Institute (AISI) je 21. svibnja 2026. objavio izvještaj koji analizira budućnost nadzora nad naprednim AI sustavima na temelju 25 ekspertnih intervjua iz industrije, vlada i akademije. Glavni nalaz: postojeći nadzor počiva na temeljima koji će vjerojatno erodirati. Identificirano je 20+ različitih putanja degradacije nadzornih mehanizama, s posebnim naglaskom na latentno reasoning, capability masking, vanjske AI akcije i AI-to-AI komunikaciju.

🤝 Agenti (5)

🔴 🤝 Agenti 22. svibnja 2026. · 3 min čitanja

Microsoft Research: MagenticLite + Fara1.5 (4B/9B/27B) — agentic AI optimiziran za male modele postiže SOTA

Editorial illustration: MagenticLite + Fara1.5 (4B/9B/27B) — agentic AI optimiziran za male modele postiže SOTA

Microsoft Research je 21. svibnja 2026. objavio trojku za agentic AI s malim modelima: MagenticLite (browser i filesystem UI aplikacija), MagenticBrain (14B orchestration model fine-tuned iz Qwen 3 14B) i Fara1.5 (computer-use model u 4B, 9B i 27B varijantama). Fara1.5-27B dostiže preko 90% SOTA na Online-Mind2Web benchmarku (300 web zadataka), gotovo udvostručujući performanse prethodnog Fara-7B. Cilj je pokazati da agentic AI ne zahtijeva goleme modele — samo dobro koodesignirane alate i harness.

🟡 🤝 Agenti 22. svibnja 2026. · 3 min čitanja

AWS: Nova Act dobio HIPAA-eligibility — agentska automatizacija ePHI za zdravstvene radne tokove

Editorial illustration: Nova Act dobio HIPAA-eligibility — agentska automatizacija ePHI za zdravstvene radne tokove

AWS je 21. svibnja 2026. najavio da je Amazon Nova Act, agentski AI servis za automatizaciju browser i UI workflowa, dobio HIPAA-eligibility status. Zdravstvene organizacije sada mogu koristiti Nova Act za rad sa zaštićenim zdravstvenim informacijama (ePHI) — autoriziranu predautorizaciju, verifikaciju osiguranja i slanje referrala kroz web portale dobavljača. Servis se integrira s Amazon Bedrock AgentCore i Strand Agents frameworkom, zahtijeva potpisani BAA ugovor i AWS KMS enkripciju, te trenutno radi samo u US East (N. Virginia) regiji.

🟡 🤝 Agenti 22. svibnja 2026. · 2 min čitanja

Anthropic: Claude Code v2.1.147 uvodi Workflow tool za deterministički multi-agent orchestration

Editorial illustration: Claude Code v2.1.147 uvodi Workflow tool za deterministički multi-agent orchestration

Anthropic je 21. svibnja 2026. u 20:39 UTC izdao Claude Code v2.1.147, novu CLI verziju koja uvodi Workflow tool — prvi deterministički multi-agent orchestration mehanizam u Claude Code ekosustavu. Tool je inicijalno onemogućen po defaultu i aktivira se preko CLAUDE_CODE_WORKFLOWS=1 environment varijable. Ista verzija preimenuje postojeću /simplify komandu u /code-review s razinama napora (high/medium/low) te dodaje sandbox hardening protiv prototype-pollution i thenable-based escape napada.

🟡 🤝 Agenti 22. svibnja 2026. · 3 min čitanja

LangChain: Od token streama do agent streama — tipizirani kanali zamjenjuju klasično streamanje za multi-agent UI

Editorial illustration: Od token streama do agent streama — tipizirani kanali zamjenjuju klasično streamanje za multi-agent UI

LangChain je 21. svibnja 2026. objavio post autora Christiana Bromanna i Nicka Hollona koji opisuje paradigmatsku evoluciju od token streama prema strukturiranim agent streamovima. Suvremeni AI agenti planiraju zadatke, delegiraju sub-agentima, pozivaju alate i pauziraju za human review — klasično streamanje tekstualnih tokena nije dovoljno za prikaz tog rada. LangChain predlaže tipizirane kanale koji prenose poruke, alate pozive, promjene stanja, sub-agent aktivnosti i custom događaje. Aplikacije se pretplaćuju samo na relevantne tipove, čineći UI efikasnim za long-running workloadove.

🟡 🤝 Agenti 22. svibnja 2026. · 3 min čitanja

OpenAI: Codex skaliranje na enterprise — 4 milijuna tjednih aktivnih korisnika i Codex Labs program

Editorial illustration: Codex skaliranje na enterprise — 4 milijuna tjednih aktivnih korisnika i Codex Labs program

OpenAI je 21. svibnja 2026. objavio enterprise skaliranje Codex platforme — agentskog coding alata koji je dostigao 4 milijuna tjednih aktivnih korisnika. Najavljen je novi Codex Labs program i partnerstva s velikim konzultantskim tvrtkama koje će pomoći velikim poduzećima u implementaciji i skaliranju Codexa. Vijest označava formalni enterprise go-to-market potez koji Codex pozicionira kao direktnog konkurenta GitHub Copilotu u srednjem i visokom segmentu tržišta.

🏥 U praksi (2)

🟡 🏥 U praksi 22. svibnja 2026. · 3 min čitanja

arXiv:2605.21427: PALS — power-aware LLM serving za MoE modele postiže +26.3% energetske efikasnosti i 4-7× manje QoS povreda

Editorial illustration: 2605.21427: PALS — power-aware LLM serving za MoE modele postiže +26.3% energetske efikasnosti i 4-7× manje QoS pov

Istraživači su 21. svibnja 2026. na arXiv preprint serveru objavili PALS — runtime sustav koji integrira GPU power kontrolu direktno u LLM serving za Mixture-of-Experts modele. PALS koristi lagane offline power-performance modele i feedback controller koji dinamički optimizira konfiguracije po throughput ciljevima. Postiže 26.3% poboljšanje energetske efikasnosti i 4-7× redukciju QoS povreda pod power ograničenjima, integrira se u vLLM bez izmjene API-ja ili retreininga modela. Adresira sve veću operativnu boljku data centara — energetska potrošnja GPU clustera koja postaje dominantno ograničenje rasta.

🟢 🏥 U praksi 22. svibnja 2026. · 3 min čitanja

CNCF: NetEase Games postigao 30-sekundni LLM cold start na Kubernetesu preko Fluid prefetching slojeva

Editorial illustration: NetEase Games postigao 30-sekundni LLM cold start na Kubernetesu preko Fluid prefetching slojeva

CNCF je 21. svibnja 2026. objavio case study iz NetEase Games (autori Haifeng Liao i Xiang Zhang) koji opisuje kako su uz CNCF-inkubirani Fluid projekt smanjili vrijeme učitavanja 70B-klasnih LLM modela s 42 minute (direktan pristup S3) na ispod 30 sekundi. Ključ je Fluid prefetching sloj koji dijeli modele između timova umjesto višestrukog cachiranja, uz pre-warming raspoređivanje koje eliminira cold startove. Tehnički case study za sve koji rade serverless LLM inference na Kubernetes-u s velikim modelima.

🛡️ Sigurnost (2)

🟡 🛡️ Sigurnost 22. svibnja 2026. · 3 min čitanja

Microsoft Research: Vega — ZK proofs za digitalni identitet, 92ms generiranje i 70% brži ponovljeni dokazi

Editorial illustration: Vega — ZK proofs za digitalni identitet, 92ms generiranje i 70% brži ponovljeni dokazi

Microsoft Research je 21. svibnja 2026. predstavio Vega — sustav zero-knowledge dokaza koji dokazuje činjenice iz državnih dokumenata (dob, status, kvalifikacije) bez otkrivanja samog dokumenta. Generiranje dokaza traje 92ms na standardnim uređajima, proof veličina je 108KB, verifikacija 23ms. Ključna inovacija je fold-and-reuse proving koji čini svaki sljedeći dokaz iste kredencijale do 70% brži, te lookup-centric circuit design koji izbjegava parsing cijelog CBOR dokumenta. Vega je posebno relevantan za AI agente koji trebaju dokazati identitet u korisnikovo ime bez čuvanja osjetljivih podataka.

🟡 🛡️ Sigurnost 22. svibnja 2026. · 3 min čitanja

OECD AI: Kolektivna AI sigurnost zahtijeva G7 koordinaciju — prompt injection, agent sigurnost i model poisoning prioriteti

Editorial illustration: Kolektivna AI sigurnost zahtijeva G7 koordinaciju — prompt injection, agent sigurnost i model poisoning prioriteti

OECD AI je 21. svibnja 2026. objavio policy izvještaj autora de Rivoire, de Leusse, Seger i Butts koji argumentira da AI sigurnost zahtijeva međunarodnu koordinaciju jer prelazi okvire klasične kibernetske sigurnosti. Tri prioritetna područja su identificirana: obrana od prompt injection napada s reusable napadačkim metodama, sigurnost AI agenata koji autonomno pristupaju alatima i memoriji, te sprječavanje model poisoninga gdje mali broj zagađenih dokumenata može kompromitovati modele različitih veličina. Izvještaj preporučuje koordinaciju kroz G7 i OECD-GPAI mehanizme uz aktivnu javno-privatnu suradnju.

← Prethodni dan Sljedeći dan →