🏥 U praksi

100 vijesti

🟡 🏥 U praksi 23. svibnja 2026. · 3 min čitanja

arXiv:2605.22681: CUSP benchmark pokazuje da frontier modeli ne mogu pouzdano predviđati znanstvene proboje

Editorial ilustracija: znanstvena krivulja s točkom prijeloma i AI sustav koji promaši predikciju

CUSP benchmark testira sposobnost AI modela da predviđa znanstvene proboje na bazi od 4.700 događaja. Frontier modeli (GPT-5, Claude Opus 4.7, Gemini 3 Pro) identificiraju plausibilne smjerove istraživanja, ali sustavno pogađaju ishode i timing s prekomjernom sigurnošću. Dodatan pre-cutoff kontekst ne pomaže — limitacija je strukturalna, ne informacijska.

🟡 🏥 U praksi 23. svibnja 2026. · 3 min čitanja

GitHub: Gartner Magic Quadrant 2026 — GitHub Copilot Leader treću godinu zaredom za Enterprise AI Coding Agents

Editorial ilustracija: kvadrant matrica s GitHub Copilot pozicioniranim u Leader sektoru

Gartner je u svojem Magic Quadrant izvještaju za 2026. pozicionirao GitHub kao Leadera u kategoriji Enterprise AI Coding Agents — treću godinu zaredom. GitHub Copilot trenutno koristi 140.000 organizacija širom svijeta, a ocjenjivanje je naglasilo agentic workflowove koji pokrivaju cijeli SDLC od koda do reviewa, sigurnosti i governance, ne samo generiranje koda.

🟢 🏥 U praksi 23. svibnja 2026. · 4 min čitanja

arXiv:2605.22337: Meta-Soft uvodi kompresiju KV cachea kroz composable meta-tokene i naučljive ortogonalne baze

Editorial ilustracija: meta-tokeni koji sažimaju attention cache u ortogonalnu baznu strukturu

Istraživači su predstavili Meta-Soft, novu metodu za dinamičku kompresiju KV cachea u LLM inferenciji. Pristup koristi naučljivu ortogonalnu baznu matricu i selektorski mrežu koji sintetiziraju soft meta-tokene — kompresirana reprezentacija ključnih informacija iz dugog prompta. Attention-flow mehanizam preraspoređuje semantičke informacije iz uklonjenih tokena u zadržane, nadmašujući postojeće KV cache eviction metode.

🟢 🏥 U praksi 23. svibnja 2026. · 4 min čitanja

arXiv:2605.22664: WorkstreamBench testira LLM agente na end-to-end spreadsheet zadacima u financijama i frontier modeli padaju

Editorial ilustracija: Excel spreadsheet s formulama i AI agent koji ih analizira

WorkstreamBench je novi benchmark s 10 autora pod vodstvom Thomsona Yena koji testira LLM agente na realnim Excel i spreadsheet zadacima u financijskoj domeni — fakture, izvještaji, analiza troškova. GPT-4o, Claude i Gemini se uspoređuju i nijedan ne prolazi pouzdano kroz cijeli skup zadataka, što ukazuje na strukturalne nedostatke u trenutnoj agentic infrastrukturi za enterprise financije.

🟢 🏥 U praksi 23. svibnja 2026. · 2 min čitanja

Anthropic Claude Code v2.1.150 — interni infrastrukturni patch bez korisničkih promjena

Editorial ilustracija: Claude Code terminal s verzijskim numeriranjem i internim cogwheel-ovima

Anthropic je u 04:03 UTC subote objavio Claude Code CLI verziju v2.1.150, samo dan nakon v2.1.149. Release sadrži isključivo interna infrastrukturna poboljšanja bez user-facing promjena. Dostupno za Darwin, Linux i Windows na ARM64 i x64 arhitekturama, kao i Linux musl builda.

🟡 🏥 U praksi 22. svibnja 2026. · 3 min čitanja

arXiv:2605.21427: PALS — power-aware LLM serving za MoE modele postiže +26.3% energetske efikasnosti i 4-7× manje QoS povreda

Editorial illustration: 2605.21427: PALS — power-aware LLM serving za MoE modele postiže +26.3% energetske efikasnosti i 4-7× manje QoS pov

Istraživači su 21. svibnja 2026. na arXiv preprint serveru objavili PALS — runtime sustav koji integrira GPU power kontrolu direktno u LLM serving za Mixture-of-Experts modele. PALS koristi lagane offline power-performance modele i feedback controller koji dinamički optimizira konfiguracije po throughput ciljevima. Postiže 26.3% poboljšanje energetske efikasnosti i 4-7× redukciju QoS povreda pod power ograničenjima, integrira se u vLLM bez izmjene API-ja ili retreininga modela. Adresira sve veću operativnu boljku data centara — energetska potrošnja GPU clustera koja postaje dominantno ograničenje rasta.

🟢 🏥 U praksi 22. svibnja 2026. · 3 min čitanja

CNCF: NetEase Games postigao 30-sekundni LLM cold start na Kubernetesu preko Fluid prefetching slojeva

Editorial illustration: NetEase Games postigao 30-sekundni LLM cold start na Kubernetesu preko Fluid prefetching slojeva

CNCF je 21. svibnja 2026. objavio case study iz NetEase Games (autori Haifeng Liao i Xiang Zhang) koji opisuje kako su uz CNCF-inkubirani Fluid projekt smanjili vrijeme učitavanja 70B-klasnih LLM modela s 42 minute (direktan pristup S3) na ispod 30 sekundi. Ključ je Fluid prefetching sloj koji dijeli modele između timova umjesto višestrukog cachiranja, uz pre-warming raspoređivanje koje eliminira cold startove. Tehnički case study za sve koji rade serverless LLM inference na Kubernetes-u s velikim modelima.

🟡 🏥 U praksi 21. svibnja 2026. · 2 min čitanja

AWS: SageMaker AI dobiva OpenAI-kompatibilne API endpointe

Editorial illustration: AWS SageMaker AI OpenAI-kompatibilni API endpointi za drop-in zamjenu na vlastitoj GPU infrastrukturi

AWS je 20. svibnja 2026. najavio da Amazon SageMaker AI od sada izlaže OpenAI-kompatibilni API na real-time inference endpointima — drop-in zamjena za OpenAI SDK, LangChain i Strands Agents koja zahtijeva samo promjenu URL-a. Endpointi izlažu /openai/v1 putanju s podrškom za Chat Completions i streaming, dok autentikacija koristi vremenski ograničene bearer tokene generirane iz AWS credentialsa.

🟡 🏥 U praksi 21. svibnja 2026. · 2 min čitanja

Google DeepMind: WeatherNext predvidio uragan Melissa kao Kategorija 5 pet dana unaprijed

Editorial illustration: Google DeepMind WeatherNext prvi 5-dnevni Kategorija 5 forecast za uragan Melissa

Google DeepMind je 19. svibnja 2026. objavio kako je njegov WeatherNext model točno predvidio da će uragan Melissa dostići Kategoriju 5 punih pet dana unaprijed s 80 posto pouzdanosti — prvi takav slučaj u modernoj meteorologiji. Model koristi ensemble od 50 paralelnih scenarija i prošle sezone bio je top-rangirani sustav za prognozu uragana prema procjeni američkog National Hurricane Centra.

🟢 🏥 U praksi 19. svibnja 2026. · 2 min čitanja

CNCF: Kubernetes debugger briše tragove — ozbiljan problem za sigurnosne audite

Editorial illustration: CNCF upozorava da kubectl debug — alat za dijagnostiku Kubernetes kontejnera — ne ostavlja nikakav z

CNCF upozorava da kubectl debug — alat za dijagnostiku Kubernetes kontejnera — ne ostavlja nikakav zapis nakon završetka sesije. Zbog toga regulirane industrije ne mogu odgovoriti na ključno pitanje: tko je gledao koji kontejner i koliko dugo — što izravno krši zahtjeve PCI DSS i SOC 2 auditnih logova.

🟡 🏥 U praksi 16. svibnja 2026. · 2 min čitanja

GitHub: Copilot Memory pamti commit style, PR strukturu i komunikacijske preferencije korisnika kroz sve repozitorije

Editorial illustration: Copilot interface s memory ikonama koje povezuju repozitorije.

GitHub Copilot Memory User Preferences je nova personalizacijska funkcija objavljena 15. svibnja 2026. koja omogućuje Copilotu da pamti korisničke preferencije kroz cijeli ekosustav repozitorija. Memory hvata commit message style, pull request strukturu i komunikacijske preferencije (formalan vs. casual ton, level detail-a) — i primjenjuje ih dosljedno na svakom repu na koji korisnik radi. Funkcija je dio šireg Copilot personalization layer-a koji konkurira Cursor i Codeium adaptive features-ima.

🟡 🏥 U praksi 16. svibnja 2026. · 3 min čitanja

OpenAI: ChatGPT Personal Finance — Pro pretplatnici u SAD-u sigurno spajaju financijske račune za AI-powered insights

Editorial illustration: financijski dashboard s AI conversation prikazom i bankarskim integration ikonama.

ChatGPT Personal Finance je novi OpenAI feature objavljen 15. svibnja 2026. koji omogućuje Pro pretplatnicima u SAD-u sigurno spajanje financijskih računa za AI-powered insights utemeljene u korisničkom financijskom kontekstu, ciljevima i prioritetima. Funkcija proširuje ChatGPT iz general-purpose chat-a u personalized financial assistant tier, izravno konkurirajući Google Finance i Perplexity finance_search alatu (objavljenom 13.5.).

🟡 🏥 U praksi 16. svibnja 2026. · 3 min čitanja

OpenAI + Databricks: GPT-5.5 integriran u enterprise agent workflowe nakon novih OfficeQA Pro benchmark rekorda

OpenAI Databricks integracija je novo enterprise agent partnerstvo objavljeno 15. svibnja 2026. koje donosi GPT-5.5 model u Databricks platform za izgradnju agent workflowova. Najava je prvi eksplicitan deployment GPT-5.5 modela kroz partnerski kanal — model je postavljen rekorde na OfficeQA Pro benchmarcima i sad je dostupan enterprise klijentima preko Databricks Mosaic AI runtime-a. Sve Anthropic Claude alternative, Google Gemini i Mistral konkurenti dobivaju pravog izazivača u Databricks ekosustavu.

🟢 🏥 U praksi 16. svibnja 2026. · 3 min čitanja

AWS: Amazon Quick — document-level access control za S3 knowledge bases s deny-by-default i ALLOW/DENY pravilima

Editorial illustration: dokumentska baza s ACL slojem i user identity provjerom prije pristupa.

Amazon Quick document-level access control je novi enterprise RAG sigurnosni mehanizam objavljen 15. svibnja 2026. od strane Josha DeMutha. Omogućuje document-level ACL-ove za S3 knowledge bases unutar Amazon Quick-a kroz dvije konfiguracijske metode: global ACL fajl (centralizirani JSON za stable strukture) i document-level metadata fajlove. Sustav koristi deny-by-default i podržava ALLOW/DENY pravila na user i group razini, gdje DENY uvijek pobjeđuje.

🟡 🏥 U praksi 15. svibnja 2026. · 2 min čitanja

Amazon Lex: Assisted NLU LLM mod postiže 92 % intent accuracy i 84 % slot resolution bez doplate

Editorial illustration: chatbot intent flow s ML i LLM komponentama.

Amazon Lex Assisted NLU je novi LLM-powered mod za chatbote objavljen 14. svibnja 2026. koji nadograđuje tradicionalni Lex NLU s velikim jezičnim modelima. Postiže 92 % intent classification accuracy i 84 % slot resolution accuracy u prosjeku, plus 11-15 % poboljšanje intent klasifikacije i 23,5 % manje fallback responses u real-world deployment-ima. Dolazi u dva moda — Primary (svaki input) i Fallback (samo na low confidence) — uključeno u standardnu Lex cijenu.

🟢 🏥 U praksi 15. svibnja 2026. · 2 min čitanja

GitHub Copilot Cloud Agent: Auto model selection automatski bira model uz 10 % popust na token multiplier

Editorial illustration: AI agent s rotirajućim model ikonama i postotkom popusta.

GitHub Copilot Cloud Agent Auto model selection je novi feature objavljen 14. svibnja 2026. koji automatski bira optimalan model za task na temelju system health i model performance signala. Korisnici Auto moda dobivaju 10 % popust na standardni model multiplier i izuzeti su od weekly rate limita. Funkcija eliminira ručno biranje modela i adresira sve češći frustracijski pattern enterprise korisnika koji udaraju u limit prije kraja tjedna.

🟢 🏥 U praksi 15. svibnja 2026. · 2 min čitanja

IBM Consulting: Forward Deployed Units — 6-osobni AI+human podovi rade posao 30-osobnih timova u Riyadh Airu, Nestléu, Heinekenu

Editorial illustration: konsultantski pod sa 6 člana — humans i AI agenti zajedno u workspace.

IBM Forward Deployed Units (FDUs) je novi enterprise consulting model objavljen 14. svibnja 2026. od strane Mohamada Alija (Senior VP, IBM Consulting). Šestočlani podovi — senior konsultanti, engineeri i AI agenti — zamjenjuju klasične 30-osobne consulting timove. Model uvodi kontinuirano angažiranje umjesto one-shot projekt logike. Live deployment-i u Riyadh Air-u, Nestléu, Heinekenu i Pearson-u.

🟢 🏥 U praksi 15. svibnja 2026. · 3 min čitanja

OpenAI: Sea Limited (Garena, Shopee) deploya Codex kroz inženjering timove u Aziji — AI-native dev case study

Editorial illustration: Asian engineering tim sa Codex CLI prikazom na nekoliko monitora.

OpenAI Sea Codex Case Study je novi enterprise deployment članak objavljen 14. svibnja 2026. u kojem CPO Sea Limited (matica Garena i Shopee brendova) objašnjava strategiju roll-outa OpenAI Codex coding agenta kroz inženjering timove u Aziji. Sea pristupa Codex-u kao alatu za AI-native software development — fundamentalna promjena workflow-a, ne samo developer accelerator za postojeće prakse.

🟡 🏥 U praksi 14. svibnja 2026. · 2 min čitanja

Perplexity: finance_search Agent API tool vraća OHLCV, bilance, transkripte i analitičarske procjene u jednom pozivu

Editorial illustration: financial data dashboard s OHLCV grafom i AI agent strelicama.

Perplexity finance_search je novi Agent API tool objavljen u svibnju 2026. koji vraća strukturirane financijske podatke za public companies — near-real-time cijene, OHLCV ranges, pre-market i after-hours podatke, income statements, balance sheets, cash flow, earnings call transkripte, SEC filings, analitičarske procjene i ETF konstituente. Model sam odlučuje koja polja fetchati na temelju prompta.

🟢 🏥 U praksi 14. svibnja 2026. · 2 min čitanja

AWS: Pulse AI + Bedrock pipeline fine-tunira Nova Micro za financijske dokumente — 1.000 dokumenata u 3 sata

Editorial illustration: financijski dokumenti s automatiziranim ekstrakcijskim pipeline-om i strukturiranim podacima.

AWS Pulse AI + Amazon Bedrock financijski document processing je novi enterprise pipeline blueprint objavljen 13. svibnja 2026. Kombinira Pulse AI ekstrakciju iz kompleksnih financijskih dokumenata (SEC filings, balance sheets, audit materials) s fine-tuningom Amazon Nova Micro modela. Batch od 1.000 dokumenata koji je prije zahtijevao multi-day turnaround procesirao se u manje od tri sata, a fine-tuned model dosegao 100% check data extraction vs 50% baseline.

🟢 🏥 U praksi 14. svibnja 2026. · 2 min čitanja

CNCF: KubeStellar AI agenti postižu 81 % PR acceptance kroz 91 % test coverage i 63 CI/CD workflow-a

Editorial illustration: Kubernetes klaster s AI agent ikonama i CI/CD pipeline strelicama.

KubeStellar AI Agents je nova case study CNCF blog post Andy Andersona, Chief Maintainera KubeStellar Console-a, objavljen 14. svibnja 2026. Multi-cluster Kubernetes dashboard kroz dva paralelna AI coding agenta postigao 81 % PR acceptance kroz 82 dana. Infrastruktura: 63 CI/CD workflow-a, 32 nightly test suites, 91 % coverage kroz 12 shardova, bug-to-merge ~30 min. Anderson definira pet razina AI codebase zrelosti.

🟢 🏥 U praksi 14. svibnja 2026. · 2 min čitanja

GitHub: Copilot Cloud Agent REST API otvoren za fan-out refactoringa, repo setup i tjednu release pripremu

Editorial illustration: GitHub Actions workflow s autonomnim agent ikonama i REST API endpointom.

GitHub Copilot Cloud Agent REST API je novi developer endpoint objavljen 13. svibnja 2026. u public preview-u koji omogućuje programatsko pokretanje autonomnih Copilot taskova. Tri primarna use case-a: code refactoring/migration fan-out kroz mnogo repozitorija, one-click repository inicijalizacija iz developer portala i automatsko pripremanje tjednog release-a s release notes. Dostupno Copilot Business i Enterprise pretplatnicima.

🟡 🏥 U praksi 13. svibnja 2026. · 2 min čitanja

GitHub: Copilot Pro $10, Pro+ $39 i novi Max plan $100 s flex credit modelom

Editorial illustration: pretplatnička struktura s base i flex credit ikonama u developer sučelju.

GitHub Copilot Flex Allotments + Max plan je nova cjenovna struktura GitHub Copilota objavljena 12. svibnja 2026. s primjenom od 1. lipnja 2026. Pro tier košta $10 mjesečno uz $15 ukupne usage credit-e, Pro+ $39 uz $70 credit-a, a novi Max plan $100 uz $200 credit-a. Code completions i next edit suggestions ostaju neograničeni na svim plaćenim razinama.

🟡 🏥 U praksi 13. svibnja 2026. · 2 min čitanja

Perplexity: travanjski changelog dodaje Claude Opus 4.7, GPT-5.5 i Grok 4.20 Reasoning u Agent API

Editorial illustration: API endpoints s ikonama modela i sigurnosnih ključeva u developer panelu.

Perplexity April 2026 changelog je novi paket Perplexity Agent API ažuriranja koji dodaje Claude Opus 4.7, GPT-5.5 i Grok 4.20 Reasoning modele, native n8n integraciju, dostupnost na AWS Marketplace kao SaaS, one-time API key reveal sigurnosni model i novi /v1/models endpoint u OpenAI-compatible formatu.

🟡 🏥 U praksi 12. svibnja 2026. · 2 min čitanja

Anthropic: Claude Code v2.1.139 — Agent View prikaz svih sesija + /goal naredba za autonomno dovršavanje

Editorial illustration: Claude Code v2.1.139 — Agent View prikaz svih sesija + /goal naredba za autonomno dovršavanje

Claude Code v2.1.139 je izdanje Anthropicovog CLI agenta koje uvodi Agent View u Research Preview fazi — jedinstveni popis svih sesija (aktivnih, blokiranih, završenih) — te /goal naredbu koja Claude tjera da radi kroz više poteza dok ne ispuni zadani uvjet, uz panel s vremenom, brojem koraka i potrošnjom tokena.

🟡 🏥 U praksi 12. svibnja 2026. · 3 min čitanja

IBM: Red Hat AI Inference i OpenShift Virtualization Service objavljeni kao managed proizvodi na IBM Cloud-u

Editorial illustration: enterprise cloud infrastructure with red and blue glow, abstract servers running inference workloads, hybrid VM and container orchestration.

IBM je danas najavio Red Hat AI Inference Service i Red Hat OpenShift Virtualization Service kao managed enterprise proizvode dostupne na IBM Cloud-u. Prvi nudi optimizirano serving okruženje za open-source LLM-ove (Granite, Llama, Mistral) s automatskim scaling-om i SLA jamstvima, drugi omogućuje pokretanje VM-ova i kontejnera u istoj OpenShift kontrolnoj ravnini. Cilj: reducirati operativni teret enterprise tima koji žele open-source AI bez vlastite Kubernetes infrastrukture.

🟡 🏥 U praksi 12. svibnja 2026. · 3 min čitanja

OpenAI: DeployCo — nova zasebna organizacija za enterprise AI deployment objavljena uz Q1 2026 rezultate

Editorial illustration: enterprise consulting handshake with abstract AI infrastructure pipelines, deployment lifecycle visualization.

OpenAI je u utorak pokrenuo DeployCo (The Deployment Company), zasebnu organizaciju koja pomaže poduzećima izgraditi i skalirati AI aplikacije u produkciji. Cilj: razdvojiti foundation model R&D od enterprise deployment consulting-a koji je do sad bio u istom OpenAI tim-u i stvarao operativnu napetost. DeployCo nudi managed deployment, custom evaluation, post-launch monitoring i industry-specific fine-tuning.

🟡 🏥 U praksi 11. svibnja 2026. · 2 min čitanja

OpenAI: vodič kako poduzeća skaliraju AI implementacije u organizacijama

Editorial illustration: vodič kako poduzeća skaliraju AI implementacije u organizacijama

OpenAI je objavio enterprise vodič 'How enterprises are scaling AI' koji opisuje put od preliminarnih eksperimenata do trajnog poslovnog utjecaja. Vodič se fokusira na četiri temeljna stupa: organizacijsko povjerenje, governance okvire, dizajn radnih tijekova i održavanje kvalitete pri rastu implementacija.

🟢 🏥 U praksi 11. svibnja 2026. · 1 min čitanja

Google: AI-powered Finance proširuje se na Europu — sažeci dionica, analiza portfelja, AI asistent

Editorial illustration: AI-powered Finance proširuje se na Europu — sažeci dionica, analiza portfelja, AI asistent

Google Finance je AI-powered platforma koja se ovaj tjedan proširuje na europsko tržište s punom podrškom lokalnim jezicima. Donosi AI istraživanje dionica i tržišnih trendova, napredne vizualizacije, real-time pokrivenost kriptovaluta i komoditeta, live transkripte korporativnih earnings poziva te globalno dostupan Deep Search za složena financijska pitanja.

🟡 🏥 U praksi 9. svibnja 2026. · 2 min čitanja

Anthropic: Claude Code v2.1.136 donosi 54 popravka, MCP OAuth fix i hard-deny pravilo

Editorial ilustracija: Claude Code terminal s naznakom MCP OAuth popravka i hard-deny pravila

Anthropic je objavio Claude Code v2.1.136, izdanje s 54 promjene koje uvodi novo pravilo settings.autoMode.hard_deny za bezuvjetno blokiranje radnji u auto modu, popravlja MCP OAuth race condition koji je tjerao korisnike na svakodnevnu ponovnu prijavu i rješava API grešku 400 kod proširenog razmišljanja.

🟢 🏥 U praksi 9. svibnja 2026. · 2 min čitanja

AWS: Halliburton AI asistent za seizmiku skraćuje izradu radnih tokova preko 95 posto

Editorial ilustracija: seizmički radni tok generiran iz prirodnog jezika kroz Amazon Bedrock

Halliburton je s AWS-om izgradio AI asistenta za Seismic Engine koji pretvara prirodni jezik u seizmičke radne tokove koristeći Amazon Bedrock i Claude modele. Sustav postiže uspješnost 84-97 posto i smanjuje vrijeme izrade s 2-20 minuta na 5,9-16,6 sekundi, što je preko 95 posto ubrzanje.

🟡 🏥 U praksi 8. svibnja 2026. · 2 min čitanja

GitHub: Pet rizika i okvir od 10 minuta za pregled AI pull requestova

Editorial illustration: Pet rizika i okvir od 10 minuta za pregled AI pull requestova

GitHub je objavio praktični vodič za pregled AI-generiranog koda u kojem definira pet kritičnih rizika i strukturirani okvir za code review od deset minuta. Više od jednog od pet pull requestova na platformi danas uključuje agenta.

🟡 🏥 U praksi 7. svibnja 2026. · 2 min čitanja

Anthropic: Claude Code v2.1.132 donosi 25+ popravaka i nove env varijable za hookove

Editorial illustration: Claude Code v2.1.132 donosi 25+ popravaka i nove env varijable za hookove

Anthropic je objavio Claude Code v2.1.132 sa 25+ ispravaka i dvije nove varijable okruženja: CLAUDE_CODE_SESSION_ID za hook integraciju i CLAUDE_CODE_DISABLE_ALTERNATE_SCREEN za native scrollback. Riješen je i ozbiljan bug s 10GB+ RSS rastom memorije kod MCP servera.

🟡 🏥 U praksi 7. svibnja 2026. · 2 min čitanja

Anthropic: Claude Code v2.1.133 donosi worktree.baseRef i popravak race conditiona

Editorial illustration: Claude Code v2.1.133 donosi worktree.baseRef i popravak race conditiona

Anthropic je objavio Claude Code v2.1.133 s novim parametrima worktree.baseRef, sandbox.bwrapPath/socatPath i okolišnom varijablom CLAUDE_EFFORT u hookovima. Verzija popravlja race condition u paralelnim sesijama i probleme na Windows drive root putanjama. Treći release ovog tjedna nakon v2.1.131 i v2.1.132.

🟡 🏥 U praksi 7. svibnja 2026. · 2 min čitanja

GitHub: Optimizacijom agentnih workflowa postignute uštede tokena od 19% do 62%

Editorial illustration: Optimizacijom agentnih workflowa postignute uštede tokena od 19% do 62%

GitHub je instrumentirao produkcijske agentne workflowe i identificirao tri glavna izvora rasipanja tokena: nepotrebne MCP alate, deterministično dohvaćanje podataka i pogrešno konfigurirana bash pravila. Optimizacijom je postignuta ušteda od 19% do 62% po workflowu.

🟢 🏥 U praksi 7. svibnja 2026. · 2 min čitanja

arXiv:2605.04012: SymptomAI u Fitbit aplikaciji s 13.917 pacijenata nadmašuje nezavisne kliničare u diferencijalnoj dijagnozi

Editorial illustration: korisnik razgovara sa SymptomAI agentom u Fitbit aplikaciji dok pozadinski panel prikazuje rangiranu listu dijagnoza

SymptomAI je konverzacijski AI agent integriran u Fitbit aplikaciju i testiran na otprilike 13.917 sudionika; u podskupu kliničke evaluacije njegove dijagnostičke preporuke postigle su odds ratio 2,47 u odnosu na nezavisne kliničare koji su ocjenjivali iste razgovore. Studija je preprint.

🟡 🏥 U praksi 6. svibnja 2026. · 2 min čitanja

IBM: Enterprise Advantage dobiva Context Studio — Providence Health smanjio menadžersko vrijeme zapošljavanja 90 %

Editorial illustration: IBM Enterprise Advantage Context Studio za AI agente s podacima organizacije

IBM je proširio Enterprise Advantage platformu lansiranjem Context Studija, alata za izgradnju AI agenata utemeljenih na vlastitim podacima organizacije uz očuvanje digitalnog suvereniteta. Providence Health smanjio je menadžersko vrijeme zapošljavanja 90 %, a IBM projektira smanjenje operativnih troškova preko 25 % unutar 18 mjeseci.

🟢 🏥 U praksi 6. svibnja 2026. · 2 min čitanja

Anthropic: Claude Code v2.1.131 — Windows VS Code aktivacija i Mantle x-api-key hotfix

Editorial illustration: Claude Code v2.1.131 hotfix za Windows VS Code i Mantle autentikaciju

Anthropic je objavio Claude Code v2.1.131, hotfix izdanje koje rješava dvije greške: pad aktivacije VS Code ekstenzije na Windowsima zbog hardkodiranog build patha i izostanak x-api-key headera prema Mantle inferencijskim endpointima. Binarne verzije objavljene su za sve glavne platforme.

🟡 🏥 U praksi 5. svibnja 2026. · 2 min čitanja

arXiv:2605.02740: ReClaim — foundation model na 200 milijuna pacijentskih zapisa postiže mean AUC 75,6 % na 1000+ medicinskih zadataka

Editorial illustration: developer workspace s monitorima koji prikazuju kod, stetoskop i medicinski grafikoni

Novi arXiv preprint predstavlja ReClaim — foundation model s 1,7 milijardi parametara treniran na 43,8 milijardi medicinskih događaja iz 200 milijuna pacijentskih zapisa. Na više od 1000 dijagnostičkih zadataka postiže mean AUC od 75,6 %, značajno nadmašujući LightGBM (66,3 %) i Delphi specijalizirani model (69,4 %). Otvara novu klasu foundation modela treniranih na administrativnim zdravstvenim podacima.

🟡 🏥 U praksi 5. svibnja 2026. · 3 min čitanja

Anthropic Claude Code v2.1.128: 30+ ispravaka, .zip plugin podrška i ~3× manji cache_creation trošak za sub-agente

Editorial illustration: developer workspace s monitorima, .zip arhivom i progress bar instalacije plugina

Claude Code v2.1.128 (objavljen 4. svibnja 2026.) donosi 30+ poboljšanja: prikaz broja alata u /mcp panelu s flagging-om servera s 0 alata, podršku za .zip plugin arhive u --plugin-dir, fix EnterWorktree buga koji je gubio lokalne nepushed commite, ~3× smanjenje cache_creation troška za sub-agente, i fix crasha pri pipingu većem od 10 MB inputa.

🟡 🏥 U praksi 4. svibnja 2026. · 3 min čitanja

IBM studija: 76 % organizacija ima Chief AI Officera, CEO-i očekuju 48 % autonomnih AI odluka do 2030.

IBM Institute for Business Value je objavio studiju nad 2.000 izvršnih direktora iz 33 zemlje koja pokazuje da se uloga Chief AI Officera proširila s 26 % na 76 % organizacija u jednoj godini. CEO-i očekuju da će do 2030. AI sustavi donositi 48 % operativnih odluka bez ljudske intervencije, što redefinira strukturu cijelog C-suitea.

🔴 🏥 U praksi 1. svibnja 2026. · 2 min čitanja

DeepMind AI co-clinician: u slijepoj evaluaciji 98 primary care upita liječnici preferirali sustav nad vodećim alatima, nula kritičnih grešaka u 97/98 slučajeva

Editorial illustration: AI agent koji u kliničkoj sceni asistira liječniku s pacijentom uz medicinsku opremu

Google DeepMind je 30. travnja 2026. najavio AI co-clinician istraživačku inicijativu — model triadic care u kojem AI agent asistira pacijentima pod kliničkim nadzorom liječnika. U slijepim head-to-head evaluacijama 98 realističnih primary care upita liječnici su konzistentno preferirali odgovore co-clinicianu nad dva vodeća alata za sintezu dokaza, a sustav je zabilježio nula kritičnih grešaka u 97 od 98 slučajeva.

🟡 🏥 U praksi 1. svibnja 2026. · 2 min čitanja

Amazon Nova 2 Lite uz Reinforcement Fine-Tuning postiže 4,33/5,0 i nadmašuje Claude Sonnet 4.5 na automatiziranoj reviziji pravnih ugovora

Editorial illustration: AI sudac na podiju ocjenjuje pravni ugovor dok robotska ruka označava klauzule

Reinforcement Fine-Tuning (RFT) je metoda treniranja u kojoj jezični model služi kao sudac (LLM-as-Judge) i daje povratnu informaciju umjesto skupog ručnog labeliranja. Amazon Nova 2 Lite je tako postigao agregatni rezultat 4,33/5,0 i savršenu JSON validaciju 1,00, nadmašivši Claude Sonnet 4.5 i Claude Haiku 4.5 na automatiziranoj reviziji pravnih ugovora.

🟢 🏥 U praksi 1. svibnja 2026. · 2 min čitanja

IBM Research i Dallara: AI surrogate model GIST evaluira aerodinamiku trkaćeg automobila u 10 sekundi umjesto sati klasične CFD simulacije

Editorial illustration: trkaći automobil i strelica koja prikazuje brzu simulaciju strujanja oko stražnjeg difuzora

GIST (Gauge-Invariant Spectral Transformer) je AI surrogate model graf-baziranih neuralnih operatora koji su zajedno razvili IBM Research i Dallara, talijanski proizvođač trkaćih automobila. Aerodinamička evaluacija stražnjeg difuzora LMP2 vozila se time skraćuje s nekoliko sati klasične CFD simulacije na otprilike 10 sekundi, a rad je predstavljen na AI & PDE Workshopu na ICLR 2026.

🟡 🏥 U praksi 30. travnja 2026. · 2 min čitanja

Anthropic Claude for Creative Work: konektori za Blender, 50+ Adobe Creative Cloud alata, Autodesk Fusion, Ableton, SketchUp i Splice

Editorial illustration: AI asistent koji povezuje 3D modeliranje, audio produkciju i grafički dizajn

Anthropic je 28. travnja 2026. najavio Claude konektore za profesionalni kreativni softver u suradnji s Blenderom, Autodesk Fusionom, Adobeom (50+ Creative Cloud alata), Abletonom, Spliceom, Affinity i Canvom, Resolume Arenom i SketchUpom. Claude može pisati Python skripte za Blender, kontrolirati Resolume u stvarnom vremenu za VJ-eve, automatizirati batch obradu aseta u Affinityju te pretraživati Splice katalog uzoraka. Anthropic se ujedno pridružio Blender Development Fundu kao patron, a tri akademske institucije — RISD, Ringling College i Goldsmiths — pokreću kolegije u kojima studenti uče raditi s Claudeom.

🟡 🏥 U praksi 30. travnja 2026. · 2 min čitanja

Google ERA: AI sustav za znanstvena istraživanja postiže CDC top za prognozu hospitalizacija, rješava neriješen kozmološki problem i prati CO2 svakih 10 minuta

Editorial illustration: znanstveni alati i AI mreža povezani u zvjezdanu konstelaciju domena

Google Research je 29. travnja 2026. predstavio ERA (Empirical Research Assistance) — interni AI sustav koji kombinira LLM-ove s računalnim alatima za ubrzanje znanstvenih istraživanja. Četiri konkretna rezultata u različitim domenama: vrh CDC ljestvice za prognozu hospitalizacija COVID/flu/RSV, šest novih rješenja za gravitacijsko zračenje kozmičkih struna, neuronska mreža koja prati atmosferski CO2 svakih 10 minuta i interpretabilni neuralni sklopovi zebrafish-a.

🟡 🏥 U praksi 30. travnja 2026. · 3 min čitanja

EvalEval Coalition: AI evaluacija postaje novi compute bottleneck — GAIA single run $2.829, HAL leaderboard $40.000, akademski auditori udaraju u budžetski zid prije tehničkog

Editorial illustration: vaga koja preteže prema evaluacijskim troškovima u odnosu na trening troškove

EvalEval Coalition (Avijit Ghosh, Yifan Mai, Georgia Channing, Leshem Choshen) objavila je 29. travnja 2026. analizu na HuggingFace blogu koja pokazuje kako su troškovi evaluacije AI modela eksplodirali. Pojedinačan GAIA run košta $2.829, HAL leaderboard $40.000 (k=8 reliability $320.000), PaperBench oko $9.500 po agentu. Statički benchmarci se kompresiraju 100-200×, agentski samo 2-3.5× — accountability barrier za nezavisne auditore.

🟡 🏥 U praksi 29. travnja 2026. · 2 min čitanja

Anthropic Claude for Creative Work: konektori za 60+ kreativnih alata, novi Claude Design produkt i partnerstva s RISD-om, Ringlingom i Goldsmiths-om

Editorial illustration: Claude konektori granaju u stack kreativnih alata od dizajna do video i 3D produkcije

Anthropic je predstavio Claude for Creative Work — paket konektora koji povezuje Claude s Adobe Photoshop, Premiere, 50+ Creative Cloud alata, Blenderom, Autodesk Fusionom, Ableton Live i Pushom, Resolume serijom, SketchUp-om, Splice-om i Affinity by Canva. Lansiran je i novi produkt Claude Design iz Anthropic Labsa za vizualizaciju ideja softverskih sučelja s Canva exportom. Paralelno, akademska partnerstva s RISD-om, Ringling Collegeom i Goldsmiths University of London-om uvode Claude u kurikule kreativne komputacije.

🟡 🏥 U praksi 29. travnja 2026. · 2 min čitanja

IBM lansirao Bob: AI development partner za cijeli SDLC s 80.000+ internih korisnika i 45% prosječnog produktivnog uplifta

Editorial illustration: zupčanici software development lifecyclea s asistentskim emblemom u središtu

IBM je 28. travnja 2026. lansirao 'Bob', AI partnera za cijeli software development lifecycle: planiranje, dizajn, kodiranje, testiranje, deploy, operacije i modernizaciju. Bob orkestrira modele Anthropic Claude, Mistral i IBM Granite, već ga interno koristi 80.000+ IBM zaposlenika s prosječnim 45% produktivnim upliftom, a dostupan je kao SaaS s besplatnim 30-dnevnim trialom na bob.ibm.com.

🟡 🏥 U praksi 29. travnja 2026. · 1 min čitanja

OpenAI dolazi na AWS: GPT modeli, Codex i Managed Agents sada dostupni unutar AWS okruženja za enterprise korisnike

OpenAI je 28. travnja 2026. objavio da su GPT modeli, Codex i Managed Agents sada dostupni na AWS-u, omogućujući enterprise korisnicima da grade sigurne AI sustave unutar svojih AWS okruženja. Najava dolazi isti dan kad i amendirani OpenAI × Microsoft partnership. Riječ je o prvoj OpenAI distribuciji izvan Microsoft Azure ekosustava.

Pogledaj cijelu arhivu →