🤝 Agenti

145 vijesti

🔴 🤝 Agenti 23. svibnja 2026. · 3 min čitanja

arXiv:2605.22502: Kompiliranjem agentskih workflowa u LLM težine postiže se near-frontier kvaliteta uz 100 puta nižu cijenu

Editorial ilustracija: workflow čvorovi koji se urušuju u kompaktnu jezgru neuronske mreže

Istraživači su pokazali da se kompleksni agentski workflowi mogu enkodirati direktno u težine manjeg fine-tuned modela umjesto u eksternu orkestraciju poput LangChaina ili LangGraph-a. Pristup postiže near-frontier kvalitetu uz 100 puta nižu cijenu inferencije na tri stvarna scenarija: travel booking, Zoom support i osiguranje, s workflowima od 14 do 55 čvorova.

🔴 🤝 Agenti 23. svibnja 2026. · 3 min čitanja

arXiv:2605.22794: MOSS pokazuje agente koji se sami unapređuju mijenjajući vlastiti izvorni kod

Editorial ilustracija: AI agent koji prepravlja vlastiti izvorni kod u sandbox petlji

Istraživači su predstavili MOSS, framework za autonomne agente koji se poboljšavaju prepravljanjem svog izvornog koda — ne samo prompta ili fine-tuning težina. Na OpenClaw benchmarku jedan ciklus MOSS samoevolucije podiže rezultat s 0,25 na 0,61 bez ikakve ljudske intervencije, pokazujući da agenti mogu popraviti routing, hooks i dispatch logiku koju text-only metode ne dotiču.

🟡 🤝 Agenti 23. svibnja 2026. · 3 min čitanja

arXiv:2605.22535: TerminalWorld benchmark mjeri LLM agente na stvarnim Linux terminal zadacima bez simulacije

Editorial ilustracija: terminal prompt s git i bash naredbama i AI agent koji ih izvršava

TerminalWorld je novi benchmark koji evaluira LLM agente na stvarnim bash, git i file operacijama u pravim Linux procesima, bez simulacije. Osmoautorski rad pod vodstvom Zhaoyang Chu i Jiarui Hu postavlja novu ljestvicu za 'computer use' agente i direktno je relevantan za alate poput Claude Code, GitHub Copilot Workspace i Cursor agentic modea.

🟡 🤝 Agenti 23. svibnja 2026. · 3 min čitanja

Anthropic Claude Code v2.1.149 donosi per-category breakdown u /usage i zatvara PowerShell permission bypass

Editorial ilustracija: terminal s usage breakdown grafikonom i security štitom

Anthropic je objavio Claude Code CLI v2.1.149 koji proširuje /usage komandu s breakdown-om troškova po kategorijama (skills, subagents, plugins, per-MCP server). Release zatvara dva sigurnosna propusta: PowerShell permission bypass kroz built-in funkcije i krivu allowlist za git worktree sandbox. Dodan je i enterprise setting allowAllClaudeAiMcps za cloud MCP konektore.

🔴 🤝 Agenti 22. svibnja 2026. · 3 min čitanja

Microsoft Research: MagenticLite + Fara1.5 (4B/9B/27B) — agentic AI optimiziran za male modele postiže SOTA

Editorial illustration: MagenticLite + Fara1.5 (4B/9B/27B) — agentic AI optimiziran za male modele postiže SOTA

Microsoft Research je 21. svibnja 2026. objavio trojku za agentic AI s malim modelima: MagenticLite (browser i filesystem UI aplikacija), MagenticBrain (14B orchestration model fine-tuned iz Qwen 3 14B) i Fara1.5 (computer-use model u 4B, 9B i 27B varijantama). Fara1.5-27B dostiže preko 90% SOTA na Online-Mind2Web benchmarku (300 web zadataka), gotovo udvostručujući performanse prethodnog Fara-7B. Cilj je pokazati da agentic AI ne zahtijeva goleme modele — samo dobro koodesignirane alate i harness.

🟡 🤝 Agenti 22. svibnja 2026. · 3 min čitanja

AWS: Nova Act dobio HIPAA-eligibility — agentska automatizacija ePHI za zdravstvene radne tokove

Editorial illustration: Nova Act dobio HIPAA-eligibility — agentska automatizacija ePHI za zdravstvene radne tokove

AWS je 21. svibnja 2026. najavio da je Amazon Nova Act, agentski AI servis za automatizaciju browser i UI workflowa, dobio HIPAA-eligibility status. Zdravstvene organizacije sada mogu koristiti Nova Act za rad sa zaštićenim zdravstvenim informacijama (ePHI) — autoriziranu predautorizaciju, verifikaciju osiguranja i slanje referrala kroz web portale dobavljača. Servis se integrira s Amazon Bedrock AgentCore i Strand Agents frameworkom, zahtijeva potpisani BAA ugovor i AWS KMS enkripciju, te trenutno radi samo u US East (N. Virginia) regiji.

🟡 🤝 Agenti 22. svibnja 2026. · 2 min čitanja

Anthropic: Claude Code v2.1.147 uvodi Workflow tool za deterministički multi-agent orchestration

Editorial illustration: Claude Code v2.1.147 uvodi Workflow tool za deterministički multi-agent orchestration

Anthropic je 21. svibnja 2026. u 20:39 UTC izdao Claude Code v2.1.147, novu CLI verziju koja uvodi Workflow tool — prvi deterministički multi-agent orchestration mehanizam u Claude Code ekosustavu. Tool je inicijalno onemogućen po defaultu i aktivira se preko CLAUDE_CODE_WORKFLOWS=1 environment varijable. Ista verzija preimenuje postojeću /simplify komandu u /code-review s razinama napora (high/medium/low) te dodaje sandbox hardening protiv prototype-pollution i thenable-based escape napada.

🟡 🤝 Agenti 22. svibnja 2026. · 3 min čitanja

LangChain: Od token streama do agent streama — tipizirani kanali zamjenjuju klasično streamanje za multi-agent UI

Editorial illustration: Od token streama do agent streama — tipizirani kanali zamjenjuju klasično streamanje za multi-agent UI

LangChain je 21. svibnja 2026. objavio post autora Christiana Bromanna i Nicka Hollona koji opisuje paradigmatsku evoluciju od token streama prema strukturiranim agent streamovima. Suvremeni AI agenti planiraju zadatke, delegiraju sub-agentima, pozivaju alate i pauziraju za human review — klasično streamanje tekstualnih tokena nije dovoljno za prikaz tog rada. LangChain predlaže tipizirane kanale koji prenose poruke, alate pozive, promjene stanja, sub-agent aktivnosti i custom događaje. Aplikacije se pretplaćuju samo na relevantne tipove, čineći UI efikasnim za long-running workloadove.

🟡 🤝 Agenti 22. svibnja 2026. · 3 min čitanja

OpenAI: Codex skaliranje na enterprise — 4 milijuna tjednih aktivnih korisnika i Codex Labs program

Editorial illustration: Codex skaliranje na enterprise — 4 milijuna tjednih aktivnih korisnika i Codex Labs program

OpenAI je 21. svibnja 2026. objavio enterprise skaliranje Codex platforme — agentskog coding alata koji je dostigao 4 milijuna tjednih aktivnih korisnika. Najavljen je novi Codex Labs program i partnerstva s velikim konzultantskim tvrtkama koje će pomoći velikim poduzećima u implementaciji i skaliranju Codexa. Vijest označava formalni enterprise go-to-market potez koji Codex pozicionira kao direktnog konkurenta GitHub Copilotu u srednjem i visokom segmentu tržišta.

🟡 🤝 Agenti 21. svibnja 2026. · 2 min čitanja

Anthropic: MCP Tunnels i self-hosted sandboxes za Claude Managed Agents

Editorial illustration: Anthropic MCP Tunnels za privatne mreže i self-hosted sandboxes za Claude Managed Agents

Anthropic je 19. svibnja 2026. u Research Preview-u predstavio MCP Tunnels — funkciju koja Claude agentima omogućuje spajanje na Model Context Protocol servere u privatnoj mreži korisnika — i self-hosted sandboxes kao alternativu Anthropic-ovoj infrastrukturi za izvođenje alata. Ažuriranja prate i dinamičko mijenjanje MCP konfiguracija unutar aktivnih sesija te automatsko prelijevanje outputa većih od 100 K tokena u sandbox file.

🟡 🤝 Agenti 21. svibnja 2026. · 2 min čitanja

Google DeepMind: Co-Scientist multi-agent AI partner za znanstveno istraživanje

Editorial illustration: Google DeepMind Co-Scientist multi-agent AI partner za ubrzanje znanstvenog istraživanja

Google DeepMind je 19. svibnja 2026. objavio Co-Scientist — multi-agent AI sustav temeljen na Geminiju koji generira, raspravlja i poboljšava znanstvene hipoteze koristeći 6 specijaliziranih agenata u Tournament of Ideas debati. Sustav je razvijen u suradnji s više od 100 istraživačkih institucija i već je dao konkretne rezultate u istraživanju fibroze jetre, ALS-a, starenja stanica i zaraznih bolesti, s vremenom analize spuštenim s mjeseci na dane.

🟡 🤝 Agenti 21. svibnja 2026. · 2 min čitanja

Google: I/O 2026 round 2 — Antigravity 2.0, Gemini Spark i Universal Cart

Editorial illustration: Google I/O 2026 drugi val lansiranja — Antigravity 2.0, Gemini Spark i Universal Cart konsolidiraju agent-first strategiju

Google je u sklopu I/O 2026 konferencije najavio drugi val velikih AI lansiranja — Antigravity 2.0 kao agent-first razvojnu platformu s CLI i SDK-om, Gemini Spark kao stalni osobni AI agent koji radi u pozadini na uređaju, i Universal Cart kao AI shopping assistant integriran kroz Google servise. Trojac dolazi nakon Gemini 3.5 Flash i Omni objava (već pokrivenih u prethodnom run-u) i konsolidira Googleovu strategiju agent-first ekosustava.

🟡 🤝 Agenti 21. svibnja 2026. · 2 min čitanja

LangChain: Deep Agents dobivaju QuickJS interpreters za kod između tool poziva

Editorial illustration: LangChain Deep Agents s QuickJS interpreters koji čuvaju state između tool poziva i smanjuju potrošnju tokena

LangChain je 20. svibnja 2026. uveo interpreters — ugrađene QuickJS runtime okoline u Deep Agents framework koje agentima omogućuju pisanje i izvršavanje koda između poziva alata bez serijalizacije stanja u povijest poruka. Tvrtka tvrdi do 35 posto manju potrošnju tokena na nekim zadacima jer state perzistira unutar runtime-a umjesto u kontekstu modela, uz eksplicitno kontroliran akcijski prostor bez pristupa filesystemu, mreži ili shellu po defaultu.

🟡 🤝 Agenti 20. svibnja 2026. · 2 min čitanja

Anthropic Claude Code: Scripting živih sesija i sigurnosni popravci u v2.1.145

Claude Code v2.1.145 donosi JSON ispis živih sesija za skriptiranje, proširene OTEL trace atribute za praćenje agenata te popravke sigurnosnog propusta pri odobravanju bash naredbi. Ažuriranje je dostupno putem npm install -g @anthropic-ai/claude-code.

🟡 🤝 Agenti 20. svibnja 2026. · 2 min čitanja

Anthropic: Claude za 276.000 KPMG zaposlenika u 138 zemalja

Editorial illustration: Anthropic i KPMG sklopili su stratešku globalnu alijansu kojom Claude dobiva pristup svim zaposlenic

Anthropic i KPMG sklopili su stratešku globalnu alijansu kojom Claude dobiva pristup svim zaposlenicima jedne od četiri najveće revizorske tvrtke na svijetu. Claude se ugrađuje u KPMG-ov Digital Gateway, a KPMG postaje Anthropicov preferred partner za sektor privatnog kapitala.

🟡 🤝 Agenti 20. svibnja 2026. · 2 min čitanja

AWS: Tri arhitekturna uzorka za skalabilne glasovne agente s Amazon Nova Sonic

AWS je objavio detaljan vodič za skalabilne glasovne agente koji koriste Amazon Nova Sonic i AgentCore Gateway. Tri arhitekturna uzorka — direktni alati, sub-agenti i segmentacija sesija — nude različite kompromise između latencije i operativne složenosti.

🟡 🤝 Agenti 20. svibnja 2026. · 2 min čitanja

GitHub Copilot dobiva Gemini 3.5 Flash: brzina i kvaliteta za svakodnevno kodiranje

Editorial illustration: Google-ov Gemini 3.5 Flash model postaje općenito dostupan za sve GitHub Copilot planove. Obećava kv

Google-ov Gemini 3.5 Flash model postaje općenito dostupan za sve GitHub Copilot planove. Obećava kvalitetu blisku Pro-razini uz brzinu i niži trošak Flash-tiera, s naglaskom na agentic radne tokove i višestruka IDE okruženja.

🟢 🤝 Agenti 20. svibnja 2026. · 2 min čitanja

arXiv:2605.18703: EnvFactory – RL trening agenata za alate s 5× manjim skupom okruženja

EnvFactory je novi okvir koji automatski sintetizira izvršna okruženja za trening tool-use agenata. Na Qwen3 modelima postiže +15% na BFCLv3 i +8.6% na MCP-Atlas benchmarku koristeći svega 85 verificiranih okruženja — pet puta manje od usporednih pristupa.

🟢 🤝 Agenti 20. svibnja 2026. · 2 min čitanja

arXiv:2605.18565: LongMINT — zašto AI agenti zaboravljaju sve što im kažeš

LongMINT je prvi benchmark koji mjeri upravljanje memorijom AI agenata u dugim dinamičnim scenarijima. S 15.600 pitanje-odgovor parova i kontekstom do 1,8 milijuna tokena, prosječna točnost testiranih sustava iznosi samo 27,9% — slabije od slučajnog pogađanja u velikom broju slučajeva.

🟢 🤝 Agenti 20. svibnja 2026. · 2 min čitanja

arXiv:2605.20173: 6 arhitektonskih obrazaca za produkcijske LLM agente

Editorial illustration: Novi arXiv rad uvodi stochastic-deterministic boundary kao temeljni dizajn princip produkcijskih LLM

Novi arXiv rad uvodi stochastic-deterministic boundary kao temeljni dizajn princip produkcijskih LLM agenata te definira 6 composable runtime obrazaca — od hijerarhijske delegacije do human-in-the-loop — koji se biraju prema tri arhitektonske brige: koordinaciji, stanju i kontroli.

🔴 🤝 Agenti 19. svibnja 2026. · 3 min čitanja

Anthropic: Akvizicija Stainlessa integira MCP server tooling i SDK razvoj direktno u Claude platformu

Editorial illustration: Anthropic je 18. svibnja 2026. preuzeo Stainless, tvrtku osnovanu 2022. koja stoji iza svih službeni

Anthropic je 18. svibnja 2026. preuzeo Stainless, tvrtku osnovanu 2022. koja stoji iza svih službenih Anthropic SDK-ova i MCP server toolinga. Stainless gradi SDK-ove za stotine tvrtki, a akvizicija cilja boljoj integraciji Claude agenata s eksternim podacima i alatima.

🔴 🤝 Agenti 19. svibnja 2026. · 3 min čitanja

Anthropic: MCP Tunnels, vlastiti sandboxevi i automatski file-spill za agente

Editorial illustration: Anthropic je u Claude API platformi uveo tri važna ažuriranja za graditelje agenata: MCP Tunnels za

Anthropic je u Claude API platformi uveo tri važna ažuriranja za graditelje agenata: MCP Tunnels za spajanje na privatne mreže bez izlaganja internetu, self-hosted sandboxeve kao alternativu Anthropicovoj infrastrukturi i automatski file-spill za tool outpute koji premašuju 100K tokena.

🟡 🤝 Agenti 19. svibnja 2026. · 2 min čitanja

arXiv:2605.18661: AI za automatsko istraživanje — Roadmap i korisnički vodič

Editorial illustration: arXiv paper 2605.18661 istraživača s NUS-a i NTU-a analizira sustave koji autonomno generiraju istra

arXiv paper 2605.18661 istraživača s NUS-a i NTU-a analizira sustave koji autonomno generiraju istraživačke papere za svega 15 dolara. Ključni nalaz: frontier LLM-ovi fabriciraju rezultate i pouzdano ne ocjenjuju novost ideja. Sveobuhvatni roadmap definira granice između pouzdane asistencije i nesigurne AI autonomije.

🟡 🤝 Agenti 19. svibnja 2026. · 2 min čitanja

arXiv:2605.16233: FORGE — AI agenti razvijaju memoriju bez fine-tuninga

Editorial illustration: arXiv:2605.16233 predstavlja FORGE, metodu kojom LLM agenti grade dijeljenu memoriju kroz populacijs

arXiv:2605.16233 predstavlja FORGE, metodu kojom LLM agenti grade dijeljenu memoriju kroz populacijsko razmjenjivanje iskustva — bez ikakvog ažuriranja težina modela. Na zadatku mrežne obrane CybORG CAGE-2 postiže 1.7–7.7× bolji rezultat od nulte bazne linije, s osobito izraženim napretkom kod slabijih modela.

🟡 🤝 Agenti 19. svibnja 2026. · 2 min čitanja

Anthropic Claude Code: v2.1.144 donosi /resume za background sesije i fix 75-sekundnog hanga

Editorial illustration: Claude Code CLI v2.1.144 uvodi /resume podršku za background sesije s prikazom trajanja poput 'Agent

Claude Code CLI v2.1.144 uvodi /resume podršku za background sesije s prikazom trajanja poput 'Agent completed · 3h 2m 5s', ispravlja 75-sekundni hang pri nedostupnom API-ju, rješava MCP tools/list paginacijski bug koji je tiho gubio alate te donosi niz terminalne i MCP popravaka.

🟡 🤝 Agenti 19. svibnja 2026. · 2 min čitanja

GitHub: Copilot CLI remote upravljanje sada opće dostupno na svim platformama

Editorial illustration: GitHub je objavio opću dostupnost (GA) remote control funkcionalnosti za GitHub Copilot CLI. Naredbo

GitHub je objavio opću dostupnost (GA) remote control funkcionalnosti za GitHub Copilot CLI. Naredbom /remote on developer može pratiti i upravljati aktivnom terminal sesijom s mobilnog uređaja, weba, VS Code-a ili JetBrains IDE-a — bez prekidanja radnog toka.

🟢 🤝 Agenti 19. svibnja 2026. · 3 min čitanja

arXiv:2605.18747: Kod kao operativni supstrat — nova paradigma AI agenata

Editorial illustration: 41 istraživač s UIUC-a i NVIDIA-e tvrdi da kod nije samo output LLM-a nego agent harness — operativn

41 istraživač s UIUC-a i NVIDIA-e tvrdi da kod nije samo output LLM-a nego agent harness — operativni supstrat koji spaja rezoniranje, djelovanje i verifikaciju u jedinstven okvir za gradnju pouzdanih AI sustava.

🟢 🤝 Agenti 19. svibnja 2026. · 2 min čitanja

arXiv:2605.16238: LLM-vođeno stablo pretrage pobjeđuje CDC u prognozi epidemija

Editorial illustration: arXiv:2605.16238 predstavlja autonomni sustav koji kombinira LLM-ove i tree search algoritme za pred

arXiv:2605.16238 predstavlja autonomni sustav koji kombinira LLM-ove i tree search algoritme za predviđanje sezonskih epidemija. U realnom vremenu, kroz sezonu 2025-26, stroj je samostalno izradio modele za influencu, COVID-19 i RSV koji su dosljedno dostigli ili nadmašili CDC-ov gold-standard human-curated ensemble.

🟡 🤝 Agenti 18. svibnja 2026. · 4 min čitanja

arXiv:2605.16217 Argus: evidence assembly arhitektura za deep research agente postiže +12,7pp s 8 paralelnih searchera

Editorial illustration: knowledge graph s evidence node-ovima i parallel searcher agentima oko centralnog navigator-a.

Argus je novi arXiv paper objavljen 15. svibnja 2026. autora Zhen Zhang, Liangcai Su, Zhuo Chen i kolega koji predstavlja evidence assembly framework za deep research agente. Sustav koristi dual-agent arhitekturu — Searcher (ReAct-style traces) + Navigator (shared evidence graph + RL synthesis) — i postiže +5,5pp s jednim Searcher-om, +12,7pp s 8 paralelnih, te 86,2 score na BrowseComp s 64 paralelnih bez prekoračenja konteksta.

🟡 🤝 Agenti 18. svibnja 2026. · 3 min čitanja

GitHub Copilot: Grok Code Fast 1 deprekiran 15. svibnja 2026.; preporučene zamjene GPT-5 mini i Claude Haiku 4.5

Editorial illustration: deprecated stamp na xAI Grok ikoni s arrows prema GPT-5 mini i Claude Haiku 4.5 logosima.

GitHub je 15. svibnja 2026. objavio formalnu deprekaciju Grok Code Fast 1 modela kroz sve Copilot experience-e (Chat, inline edits, ask, agent mode, code completions). Deprekacija dolazi tjedan dana nakon najave 8. svibnja. Preporučene zamjene: GPT-5 mini i Claude Haiku 4.5 — oba dostupna kroz standard model policies. Enterprise admini moraju omogućiti alternative kroz Copilot settings.

🟢 🤝 Agenti 18. svibnja 2026. · 4 min čitanja

Databricks + Veeva Vault CRM: tri specijalizirana AI agenta za life sciences commercial workflow

Editorial illustration: pharma sales rep s tablet i AI agent overlay s patient data dashboard.

Databricks je 18. svibnja 2026. objavio partnership s Veeva Systems koji integrira Genie AI agente direktno u Vault CRM workflow za life sciences industriju. Tri specijalizirana agent persona — Sales Rep Agent, Medical Science Liaison (MSL) Agent i Territory Manager Agent — pristupaju Databricks lakehouse-u kroz Unity Catalog governance. Najava prethodi Veeva Commercial Summit-u u Bostonu (19-20. svibnja 2026.).

🟡 🤝 Agenti 16. svibnja 2026. · 2 min čitanja

Anthropic: Claude Code v2.1.143 — 5. patch ovaj tjedan, plugin dependency enforcement i projected context cost u marketplaceu

Editorial illustration: Claude Code plugin marketplace s token cost ikonama i dependency grafom.

Claude Code v2.1.143 je nova verzija Anthropic CLI agenta objavljena 15. svibnja 2026. Peti patch ovaj tjedan nakon v2.1.139, v2.1.140, v2.1.141 i v2.1.142. Donosi plugin dependency enforcement s disable-chain hintovima, projected context cost prikaz u plugin marketplaceu (per-turn i per-invocation token procjene), novi worktree.bgIsolation setting, PowerShell -ExecutionPolicy Bypass auto-flag, i background sesije koje čuvaju model/effort kroz idle wake.

🟡 🤝 Agenti 16. svibnja 2026. · 3 min čitanja

GitHub: Accessibility Agent pregledao 3.535 PR-ova s 68 % resolution rate, otkriva LLM bias prema accessibility antipatternima

Editorial illustration: accessibility ikone (screen reader, keyboard) sa GitHub PR review prikazom.

GitHub Accessibility Agent je nova general-purpose accessibility automation case study objavljena 15. svibnja 2026. Agent je pregledao 3.535 pull requestova s 68 % resolution rate i otkrio značajan bias: LLM-ovi imaju unfortunate tendenciju proizvodnje accessibility antipatterns jer su trenirani na desetljećima inaccessible koda. GitHub koristi sequential reviewer+implementer arhitekturu (dvotijerni model) umjesto paralelnih sub-agenata — reduciralo token consumption i poboljšalo accuracy.

🟢 🤝 Agenti 16. svibnja 2026. · 3 min čitanja

arXiv:2605.14892 Survey: LIFE progresija (Lay, Integrate, Find, Evolve) za LLM multi-agent sustave

Editorial illustration: multi-agent sustav s LIFE stadijima i međuagentskim povezivanjima.

LIFE progression survey je sveobuhvatan pregled multi-agent LLM sustava objavljen 15. svibnja 2026. na arXivu autora Shihao Qi, Jie Ma, Rui Xing, Wei Guo i 14 koautora. Survey organizira područje kroz četiri kauzalno povezana stadija — Lay (pojedinačne sposobnosti), Integrate (suradnja agenata), Find (failure attribution) i Evolve (samostalno poboljšanje). Glavna teza: error propagation kroz agente stvara failures koji se rijetko prevode u strukturalno samoposboljšanje.

🟡 🤝 Agenti 15. svibnja 2026. · 2 min čitanja

Anthropic: Claude Code v2.1.142 — Fast Mode default na Opus 4.7, novi --add-dir i --mcp-config flagovi za background sesije

Editorial illustration: Claude Code terminal s background agent sesijama i flag listing-om.

Claude Code v2.1.142 je nova verzija Anthropic CLI agenta objavljena 14. svibnja 2026. Četvrti patch ovaj tjedan nakon v2.1.139, v2.1.140 i v2.1.141. Donosi osam novih flagova za claude agents background sesije (--add-dir, --settings, --mcp-config, --plugin-dir, --permission-mode, --model, --effort, --dangerously-skip-permissions). Fast Mode default je sada Opus 4.7 (umjesto Opus 4.6). Fix MCP tool timeouts, git worktree recognition, macOS sleep daemon i Windows network drive deadlock.

🟡 🤝 Agenti 15. svibnja 2026. · 3 min čitanja

GitHub: Copilot App u Technical Preview-u — standalone GitHub-native desktop agent s izoliranim sesijama i Agent Merge funkcijom

Editorial illustration: desktop app s git branch grafikom i Agent Merge tokom.

GitHub Copilot App je nova standalone GitHub-native desktop aplikacija u Technical Preview-u objavljena 14. svibnja 2026. Razlikuje se od IDE plugin-a jer pruža izolirane sesije po tasku — svaka ima vlastiti branch, fajlove, conversation state i task state. Agent Merge funkcionalnost autonomno adresira review komentare, popravlja failing checks i merge-a nakon ispunjenja uvjeta. Dostupno Copilot Pro/Pro+ kroz early access i Business/Enterprise kroz rollout.

🟢 🤝 Agenti 15. svibnja 2026. · 2 min čitanja

OpenAI: Codex from Anywhere — mobile i web rollout coding agenta s real-time monitoring i steer kontrolama

Editorial illustration: pametan telefon s Codex CLI ikonom i remote development stream-om.

OpenAI Codex from Anywhere je nova mobile i web rollout faza coding agenta objavljena 14. svibnja 2026. Developeri mogu monitor-irati, steer-ati i approve-ati coding taskove u real-time kroz ChatGPT mobile app na pametnim telefonima i tabletima. Pristup proširuje Codex iz Windows Sandbox (13.5.) i Codex CLI deploymenta u heterogena računarska okruženja, dovršavajući OpenAI cross-platform strategiju.

🟡 🤝 Agenti 14. svibnja 2026. · 2 min čitanja

Amazon Nova Sonic + WebRTC: real-time voice agenti s Kinesis Video Streams i async tool callingom za RAG/MCP

Editorial illustration: voice agent s WebRTC tokom i tool calling strelicama prema cloud sustavima.

Amazon Nova Sonic + WebRTC integracija je nova AWS arhitektura objavljena 13. svibnja 2026. za real-time voice agentne aplikacije. Speech-to-speech event procesor orkestrira media i text data eventove kroz Kinesis Video Streams WebRTC signaling, dok server-side VAD smanjuje audio tokene. Nova Sonic podržava async tool calling prema MCP serverima, Strands agentima i RAG sustavima — IoT i connected vehicle scenariji su prvi demonstracije.

🟡 🤝 Agenti 14. svibnja 2026. · 2 min čitanja

Anthropic: Claude Code v2.1.141 dodaje terminalSequence hook, Bedrock Haiku fix i Summarize up to here rewind opciju

Editorial illustration: Claude Code terminal sa novim hook ikonama i rewind kontrolama.

Claude Code v2.1.141 je nova verzija Anthropic CLI agenta objavljena 13. svibnja 2026. Treća patch verzija ovaj tjedan dodaje terminalSequence polje za hook JSON output, CLAUDE_CODE_PLUGIN_PREFER_HTTPS i ANTHROPIC_WORKSPACE_ID env varijable, claude agents --cwd path scoping te novu Rewind menu opciju Summarize up to here za kompresiju starog konteksta. Popravlja Bedrock/Vertex Haiku model ID race i daemon status na Windows-u.

🟡 🤝 Agenti 14. svibnja 2026. · 2 min čitanja

LangChain: Managed Deep Agents — hosted runtime u LangSmithu s durable execution i memory layerom

Editorial illustration: hosted agent runtime s memory i tool slojevima u cloud okruženju.

Managed Deep Agents je novi LangChain hosted agent runtime objavljen 13. svibnja 2026. u private beti unutar LangSmith platforme. Servis pruža durable execution, persistent memory, integrirano tooling i comprehensive observability — sve infrastrukturne komponente potrebne za produkcijske deep agente. Agent definicija ostaje u repozitoriju kroz standardne AGENTS.md i tools.json datoteke.

🟡 🤝 Agenti 14. svibnja 2026. · 2 min čitanja

OpenAI: Codex sandbox za Windows uvodi kontroliran filesystem i mrežna ograničenja za autonomne agente

Editorial illustration: Codex terminal s sigurnosnim slojevima oko filesystem i network pristupa.

Codex Windows Sandbox je nova OpenAI sigurnosna arhitektura objavljena 13. svibnja 2026. koja Codex agentu omogućuje sigurno izvršavanje na Windows operativnom sustavu. Sandbox uvodi kontroliran pristup filesystemu i mrežna ograničenja kako bi enable safe, efficient coding agents — Codex sad postaje cross-platform alat dostupan i Windows korisnicima, ne samo macOS/Linux developerima.

🟡 🤝 Agenti 13. svibnja 2026. · 2 min čitanja

Anthropic: Claude Code v2.1.140 popravlja /goal hang, hot-reload i Read offset validaciju

Editorial illustration: razvojni alat ekran s code lines i terminal prompt simbolima.

Claude Code v2.1.140 je nova verzija Anthropic CLI agenta objavljena 12. svibnja 2026. koja popravlja deset bugova uključujući tiho visanje /goal komande s disableAllHooks postavkom, hot-reload regresiju symlinked settings fajlova, enterprise endpoint security startup probleme i validaciju offset parametra u Read toolu. Subagent tip matching sada prihvaća case-insensitive vrijednosti.

🟡 🤝 Agenti 13. svibnja 2026. · 2 min čitanja

arXiv:2605.12061 SAGE: self-evolving graph-memory engine dosegao 91,6 % Recall@5 na Natural Questions

Editorial illustration: dinamička grafovska memorija s čvorovima i feedback strelicama.

SAGE je novi self-evolving graph-memory engine za LLM agente objavljen 12. svibnja 2026. na arXivu autora Juntong Wang i suradnika sa Sveučilišta. Engine koristi memory writer + memory reader (Graph Foundation Model) feedback loop koji se autonomno proširuje i reorganizira. Open-domain retrieval zero-shot postiže 82,5/91,6 Recall@2/5 na Natural Questions, uz poboljšanja na LongMemEval i HaluMem hallucination metrikama.

🟡 🤝 Agenti 13. svibnja 2026. · 2 min čitanja

Google DeepMind: AI Pointer omogućuje Gemini komande mišem u Chromeu i Googlebooku

Editorial illustration: kursor miša s glow zrakama integriran u browser sučelje.

AI Pointer je novi Google DeepMind eksperimentalni proizvod predstavljen 12. svibnja 2026. koji integrira Gemini model u kontekstualni pokazivač miša. Korisnici mogu pokazati i izgovoriti kratku komandu poput "Fix this" ili "Compare these" bez kopiranja sadržaja u zasebnu aplikaciju. Feature je dostupan u Chromeu odmah, a Magic Pointer dolazi na novi Googlebook laptop.

🟡 🤝 Agenti 13. svibnja 2026. · 2 min čitanja

NVIDIA: OpenShell + SAP Joule Studio donose enterprise governance autonomnim AI agentima

Editorial illustration: zaštitni sloj oko enterprise data tokova s policy enforcement simbolima.

NVIDIA OpenShell + SAP Joule Studio integracija je nova enterprise agent platforma objavljena na SAP Sapphire konferenciji 12. svibnja 2026. NVIDIA OpenShell daje izolacijski runtime i policy enforcement, SAP Business AI Platform integrira ga kao security layer, a Joule Studio nudi okruženje za izgradnju agenata. NemoClaw reference blueprint dostupan je odmah u Joule Studiju.

🟢 🤝 Agenti 13. svibnja 2026. · 2 min čitanja

arXiv:2605.11814 MedMemoryBench otkriva memory saturation u medicinskim agentima — 2.000 sesija, 16.000 turn-ova

Editorial illustration: medicinski agent s memorijskim zapisima i streaming evaluation indikatorima.

MedMemoryBench je prvi benchmark za memory mehanizme u personaliziranim healthcare agentima objavljen 12. svibnja 2026. na arXivu. Tim sa Sveučilišta Zhejiang izgradio je ~2.000 sesija i 16.000 turn-ova kroz human-agent collaborative pipeline. Glavni nalaz: mainstream AI arhitekture pokazuju memory saturation gdje continuous information influx degradira performance u medicinskom rasuđivanju.

🟡 🤝 Agenti 12. svibnja 2026. · 3 min čitanja

arXiv:2605.10344: TMAS — multi-agent test-time scaling postiže nove rekorde na reasoning benchmarcima

Editorial illustration: multiple AI agent nodes connected in collaborative network with hierarchical memory banks, glowing reasoning paths.

TMAS (Test-time Multi-Agent Scaling) je novi pristup test-time compute scaling-u koji organizira LLM inferencu kao kolaboraciju između specijaliziranih agenata s hijerarhijskim memorijskim bankama. Autori (UC Berkeley + DeepMind) pokazuju nadmašivanje svih postojećih baseline metoda (Best-of-N, MCTS, AutoTTS) na MATH-500, AIME 2024, HumanEval i GPQA Diamond uz isti compute budget. Kombinira reasoning + retrieval + verification u jednoj pipelin-i.

🟡 🤝 Agenti 12. svibnja 2026. · 3 min čitanja

AWS: Strands Agents SDK + Exa integracija omogućuje agentima autonomno web pretraživanje bez custom crawlera

Editorial illustration: open-source SDK agent connecting to AI-native search engine, abstract data flows representing autonomous web queries.

AWS Strands Agents SDK je open-source framework za izgradnju autonomnih AI agenata koji je dobio duboku integraciju s Exa, AI-native tražilicom koja indeksira web na semantičkoj razini. Agent sada može autonomno odlučiti kada pretraživati web, sintetizirati izvještaje iz više izvora i citirati podatke — bez izgradnje custom crawlera ili scraper infrastrukture. Integracija pojednostavljuje izradu web search-enabled agenata na desetak linija koda.

🟡 🤝 Agenti 12. svibnja 2026. · 2 min čitanja

Microsoft Research: SocialReasoning-Bench otkriva da AI agenti dovršavaju zadatke ali ne brane interese korisnika

Editorial illustration: SocialReasoning-Bench otkriva da AI agenti dovršavaju zadatke ali ne brane interese korisnika

SocialReasoning-Bench je novi Microsoft Research benchmark koji mjeri zastupa li AI agent stvarne interese korisnika tijekom pregovora s drugim stranama — ne samo dovršava li zadatak. Rezultati pokazuju da modeli skoro savršeno zaključuju poslove ali konzistentno ostavljaju vrijednost na stolu, s 90%+ neefikasnih ili nemarnih ishoda u marketplace scenarijima.

🟢 🤝 Agenti 12. svibnja 2026. · 2 min čitanja

arXiv:2605.07313: agent memory ne skalira — HippoRAG gubi 16-20 pp pouzdanosti s rastom irelevantnih sesija

Editorial illustration: 2605.07313: agent memory ne skalira — HippoRAG gubi 16-20 pp pouzdanosti s rastom irelevantnih sesija

Rad arXiv:2605.07313 je scale-conditioned evaluacijski protokol koji testira ostaju li sustavi memorije agenata funkcionalni dok se gomilaju irelevantni podaci. HippoRAG gubi 16-20 postotnih bodova budget-compliant pouzdanosti, dok LiCoMemory varira ovisno o veličini modela. Autori (Shao, Lu, Zhang, Luo) zaključuju da gubitak pouzdanosti nije jedinstvena pojava.

Pogledaj cijelu arhivu →