Ponedjeljak, 18. svibnja 2026.

11 vijesti — 🟡 5 važno , 🟢 6 zanimljivo

🤖 Modeli (1)

🟡 🤖 Modeli 18. svibnja 2026. · 3 min čitanja

GitHub Copilot: GPT-5.3-Codex postaje base model za Business i Enterprise s 12-mjesečnim LTS jamstvom

GitHub je 17. svibnja 2026. objavio da GPT-5.3-Codex zamjenjuje GPT-4.1 kao base model za Copilot Business i Enterprise. Promjena se odnosi samo na enterprise tier (ne Copilot Pro, Pro+ ili Free). GPT-5.3-Codex je prvi LTS (long-term support) model — zajamčena dostupnost 12 mjeseci od 5. veljače 2026. do 4. veljače 2027. Pricing: 1× premium request multiplier; GPT-4.1 ostaje force-enabled na 0× multiplier do deprecation-a 1. lipnja 2026.

📦 Open Source (6)

🟡 📦 Open Source 18. svibnja 2026. · 3 min čitanja

arXiv:2605.15041 CAST framework: case-based calibration LLM tool use postiže +5,85pp BFCLv2 i -26 % reasoning length

Editorial illustration: LLM agent s case library prikazom i tool call validation indicators.

CAST je novi arXiv paper objavljen 14. svibnja 2026. autora Renning Pang, Tian Lan, Leyuan Liu, Piao Tong, Sheng Cao i Xiaosong Zhang koji uvodi case-based calibration framework za LLM tool use. Pristup tretira historical execution trajectories kao structured information za reinforcement learning — postiže do +5,85 postotnih bodova execution accuracy improvement nad BFCLv2 baseline-om i 26 % redukciju average reasoning length-a.

🟢 📦 Open Source 18. svibnja 2026. · 4 min čitanja

arXiv:2605.15706 Differentiable Mixture-of-Agents: dinamičko routing aktiviranje agenata postiže SOTA kroz 9 benchmarka

Editorial illustration: neural network routing graf s LLM agentima i sparse activation indicator-ima.

Differentiable Mixture-of-Agents je novi arXiv paper objavljen 15. svibnja 2026. autora Xingjian Wu, Junkai Lu, Siyu Yan, Xiangfei Qiu, Jilin Hu, Chenjuan Guo i Bin Yang koji uvodi diferencijabilni routing mehanizam za multi-agent LLM suradnju. Sustav dinamički bira i aktivira agente po koraku zaključivanja umjesto fiksne topologije, postiže SOTA rezultate kroz 9 benchmarka s test-time adaptacijom bez eksternih anotacija kroz predictive entropy self-supervision.

🟢 📦 Open Source 18. svibnja 2026. · 3 min čitanja

arXiv:2605.15100 Dual-Dimensional Consistency: 10× redukcija token consumption uz održanu accuracy kroz pet benchmarka

Editorial illustration: paralelni reasoning paths s confidence score badge-ovima i pruning ikonom.

Dual-Dimensional Consistency je novi arXiv paper objavljen 14. svibnja 2026. autora Rongman Xu, Yifei Li, Tianzhe Zhao, Yanrui Wu, Bo Li i Hang Yan koji adresira inference-time scaling efficiency. Framework kombinira Confidence-Weighted Bayesian protokol i Trend-Aware Stratified Pruning — kroz pet benchmarka demonstrira preko 10× redukciju token consumption uz održanu ili povećanu accuracy nad strong baseline-ima.

🟢 📦 Open Source 18. svibnja 2026. · 3 min čitanja

arXiv:2605.15015 Small Private LM: kompetitivni rezultati u educational assessment design uz human-in-the-loop preporuke

Editorial illustration: učionica scena s small LM ikonama, Bloom's taxonomy piramidom i human reviewer prikazom.

Small, Private Language Models as Teammates for Educational Assessment Design je novi arXiv paper objavljen 14. svibnja 2026. autora Chris Davis Jaldi, Anmol Saini, Shan Zhang, Noah Schroeder, Cogan Shimizu i Eleni Ilkou. Sustavna komparacija smaller modela protiv larger alternativa u generation pedagogically aligned assessment questions — smaller modeli dosežu kompetitivne rezultate uz privacy benefits, ali autori naglašavaju da model-based evaluations pokazuju systematic inconsistencies i preporučuju Human-in-the-Loop pristup.

🟢 📦 Open Source 18. svibnja 2026. · 3 min čitanja

arXiv:2605.15109 Traversal Context: agentic GraphRAG mora dokumentirati visited-but-uncited entitete za pravu provenance

Editorial illustration: knowledge graph s istaknutim traversal pathom i citation badge anotacijama uz uncited node-ove.

Why Neighborhoods Matter je novi arXiv paper objavljen 14. svibnja 2026. autora Riccardo Terrenzi, Maximilian von Zastrow i Serkan Ayvaz (prihvaćen za IJCAI-ECAI 2026 Joint Workshop on GENAIK and NORA). Autori argumentiraju da agentic GraphRAG sustavi moraju tretirati citation faithfulness kao trajectory-level problem — pravi provenance pokriva ne samo cited evidence, već i visited-but-uncited entitete koji utječu na model reasoning.

🟢 📦 Open Source 18. svibnja 2026. · 3 min čitanja

xAI SDK Python v1.13.0: prepare_extension() omogućuje batch video extension za serije generiranih klipova

Editorial illustration: serija video frameova s batch processing ikonom i xAI SDK kod snippet vizualizacijom.

xAI SDK Python v1.13.0 objavljen je 16. svibnja 2026. (commit autor @double-di, PR #141) i donosi novu prepare_extension() metodu za batch video extension. Funkcija proširuje video API uveden u v1.10.0 dodavanjem batch processing capabilities — developeri sada mogu prepare extension za seriju klipova u jednom pozivu umjesto sekvencijalno za svaki klip pojedinačno.

🤝 Agenti (3)

🟡 🤝 Agenti 18. svibnja 2026. · 4 min čitanja

arXiv:2605.16217 Argus: evidence assembly arhitektura za deep research agente postiže +12,7pp s 8 paralelnih searchera

Editorial illustration: knowledge graph s evidence node-ovima i parallel searcher agentima oko centralnog navigator-a.

Argus je novi arXiv paper objavljen 15. svibnja 2026. autora Zhen Zhang, Liangcai Su, Zhuo Chen i kolega koji predstavlja evidence assembly framework za deep research agente. Sustav koristi dual-agent arhitekturu — Searcher (ReAct-style traces) + Navigator (shared evidence graph + RL synthesis) — i postiže +5,5pp s jednim Searcher-om, +12,7pp s 8 paralelnih, te 86,2 score na BrowseComp s 64 paralelnih bez prekoračenja konteksta.

🟡 🤝 Agenti 18. svibnja 2026. · 3 min čitanja

GitHub Copilot: Grok Code Fast 1 deprekiran 15. svibnja 2026.; preporučene zamjene GPT-5 mini i Claude Haiku 4.5

Editorial illustration: deprecated stamp na xAI Grok ikoni s arrows prema GPT-5 mini i Claude Haiku 4.5 logosima.

GitHub je 15. svibnja 2026. objavio formalnu deprekaciju Grok Code Fast 1 modela kroz sve Copilot experience-e (Chat, inline edits, ask, agent mode, code completions). Deprekacija dolazi tjedan dana nakon najave 8. svibnja. Preporučene zamjene: GPT-5 mini i Claude Haiku 4.5 — oba dostupna kroz standard model policies. Enterprise admini moraju omogućiti alternative kroz Copilot settings.

🟢 🤝 Agenti 18. svibnja 2026. · 4 min čitanja

Databricks + Veeva Vault CRM: tri specijalizirana AI agenta za life sciences commercial workflow

Editorial illustration: pharma sales rep s tablet i AI agent overlay s patient data dashboard.

Databricks je 18. svibnja 2026. objavio partnership s Veeva Systems koji integrira Genie AI agente direktno u Vault CRM workflow za life sciences industriju. Tri specijalizirana agent persona — Sales Rep Agent, Medical Science Liaison (MSL) Agent i Territory Manager Agent — pristupaju Databricks lakehouse-u kroz Unity Catalog governance. Najava prethodi Veeva Commercial Summit-u u Bostonu (19-20. svibnja 2026.).

🛡️ Sigurnost (1)

🟡 🛡️ Sigurnost 18. svibnja 2026. · 4 min čitanja

arXiv:2605.15338 Sleeper Memory Poisoning: 99,8 % attack success rate na GPT-5.5 kroz perzistentnu memoriju LLM agenata

Editorial illustration: LLM agent memory store s dormantnim adversarial token-ima i wake-up trigger ikone.

Hidden in Memory je novi arXiv paper objavljen 14. svibnja 2026. autora Sidharth Pulipaka, Stanislau Hlebik, Leonidas Raghav, Sahar Abdelnabi, Vyas Raina, Ivaxi Sheth i Mario Fritz koji predstavlja delayed-execution attack na stateful LLM agente. Adversarial content u externom kontekstu (dokumenti, webpage) corruptira agentovu perzistentnu memoriju — 99,8 % uspjeh na GPT-5.5 i 95 % na Kimi-K2.6, s 60-89 % uspjeha pretvaranja poisoned memory u attacker-intended akciju.

← Prethodni dan Sljedeći dan →