Subota, 18. travnja 2026.

13 vijesti — 🔴 2 kritično , 🟡 7 važno , 🟢 4 zanimljivo

🤖 Modeli (4)

🟡 🤖 Modeli 18. travnja 2026. · 3 min čitanja

AWS Nova destilacija za video semantičku pretragu: 95 posto uštede i dvostruko brži inference

AWS je demonstrirao kako model distillation prebacuje inteligenciju velikog Nova Premier modela u manji Nova Micro za video search routing. Rezultati su 95 posto ušteda na troškovima inferencija, 50 posto manja latencija (833 ms umjesto 1741 ms) i zadržana kvaliteta po LLM-as-judge ocjeni (4,0 od 5). Cijeli trening koristio je 10000 sintetičkih primjera generiranih iz Nova Premiera.

🟡 🤖 Modeli 18. travnja 2026. · 4 min čitanja

AWS Nova Multimodal Embeddings za video pretragu: hibridni pristup donosi 90 posto recalla umjesto 51 posto

AWS Nova Multimodal Embeddings su nova arhitektura koja istovremeno obrađuje vizualni, audio i tekstualni sadržaj videa u zajednički 1024-dimenzionalni vektorski prostor bez pretvaranja u tekst. Kombinacija semantičkog embeddinga s BM25 leksičkom pretragom daje 90 posto Recall@5, u odnosu na 51 posto za baseline combined-mode embeddinge — skok od 30 do 40 postotnih bodova na svim mjerama.

🟡 🤖 Modeli 18. travnja 2026. · 4 min čitanja

NVIDIA Nemotron OCR v2: 34,7 stranica u sekundi, pet jezika u jednom modelu, 28 puta brže od PaddleOCR

NVIDIA je na HuggingFaceu objavila Nemotron OCR v2, multilingvalni OCR model koji obrađuje 34,7 stranica u sekundi na jednom A100 GPU-u. To je 28 puta brže od PaddleOCR v5. Model podržava engleski, kineski, japanski, korejski i ruski u jedinstvenoj arhitekturi, bez potrebe za detekcijom jezika. Treniran na 12,2 milijuna sintetičkih slika, model i dataset su dostupni pod NVIDIA Open Model licencom i CC-BY-4.0.

🟢 🤖 Modeli 18. travnja 2026. · 3 min čitanja

ArXiv AC/DC: automatsko otkrivanje specijaliziranih LLM-ova kroz koevoluciju modela i zadataka

AC/DC je novi framework prezentiran na ICLR 2026 koji istovremeno evoluira LLM modele kroz model merging i zadatke kroz sintetičke podatke. Otkrivene populacije modela demonstriraju širu pokrivenost ekspertize od ručno kurirani modela bez eksplicitne optimizacije za benchmarke. Modeli nadmašuju veće pandane uz manju GPU memoriju, što predstavlja novi paradigm u kontinuiranom razvoju LLM-a.

📦 Open Source (1)

🔴 📦 Open Source 18. travnja 2026. · 3 min čitanja

Google Gemma 4: četiri otvorena modela, 31B dense na trećem mjestu Arene, Apache 2.0 licenca

Gemma 4 je Googleova nova generacija otvorenih modela u četiri varijante: E2B za mobitele, E4B za edge uređaje, 26B MoE s 3,8 milijarde aktivnih parametara i 31B dense. 31B drži treće mjesto na Arena ljestvici otvorenih modela i navodno nadmašuje modele 20 puta veće, a 26B MoE je šesti. Svi modeli su multimodalni (tekst, slika, video, audio), podržavaju 140 jezika, imaju kontekst do 256K tokena i puštaju se pod Apache 2.0 licencom.

🤝 Agenti (2)

🟡 🤝 Agenti 18. travnja 2026. · 3 min čitanja

LangChain i Cisco pokazuju agentic engineering: 93 % kraće otkrivanje bugova i 65 % brži razvoj

Editorial ilustracija: koordinirani roj AI agenata u softverskom razvoju, apstraktna vizualizacija mreže

Agentic engineering je pristup u kojem rojevi AI agenata preuzimaju cijeli softverski životni ciklus, a ne samo pisanje koda. LangChain i Cisco inženjeri Renuka Kumar i Prashanth Ramagopal objavili su 17. travnja 2026. referentnu arhitekturu s Leader i Worker agentima, koja je u Ciscovom pilotu sa 70 korisnika i 512 sesija smanjila vrijeme otkrivanja uzroka bugova za 93 % i vrijeme izvršavanja razvojnih tokova rada za 65 %.

🟢 🤝 Agenti 18. travnja 2026. · 2 min čitanja

HuggingFace objavio Ecom-RLVE-Gym: 8 okruženja i 12-osni kurikulum za treniranje e-commerce agenata uz pojačano učenje

Editorial ilustracija: apstraktno okruženje e-commerce treninga s mrežom proizvoda i staza učenja

Owlgebra AI tim objavio je 16. travnja 2026. na HuggingFace blogu projekt Ecom-RLVE-Gym — otvoreni framework s 8 verifikabilnih okruženja za e-commerce razgovorne agente i algoritamskom nagradom umjesto LLM-sudca. Sustav koristi katalog od 2 milijuna proizvoda, Qwen 3 8B model i 12-osni adaptivni kurikulum koji agentu poetapno povećava težinu zadataka, kao odgovor na ograničenja supervizornog fine-tuninga u složenim višekorakim tokovima.

🏥 U praksi (5)

🔴 🏥 U praksi 18. travnja 2026. · 3 min čitanja

Anthropic Claude Design: vizualni suradnik pogonjen Claude Opus 4.7 za dizajn, prezentacije i prototipove

Claude Design je novi Anthropic Labs proizvod koji pretvara Claude Opus 4.7 u kolaborativni alat za vizualno kreiranje — dizajne, prototipove, prezentacije, one-pagere. Sustav automatski čita design sustav iz codebasea i design datoteka, podržava inline komentare i slidere za podešavanje, te ima direktni handoff prema Claude Codeu za implementaciju. Dostupan u research preview-u za Pro, Max, Team i Enterprise pretplatnike od 17. travnja 2026.

🟡 🏥 U praksi 18. travnja 2026. · 3 min čitanja

Anthropic: infrastrukturni šum mijenja rezultate agentskih benchmarka do 6 postotnih bodova

Istraživači u Anthropicu dokazali su da konfiguracija RAM-a i CPU headrooma može promijeniti rezultate agentskih coding benchmarka za 6 postotnih bodova — više nego što je razlika između top modela na leaderboardu. Testirali su Terminal-Bench 2.0 i SWE-bench. Preporuka: prednosti ispod 3 postotna boda zaslužuju skepticizam dok se eval konfiguracija ne dokumentira i uskladi.

🟡 🏥 U praksi 18. travnja 2026. · 2 min čitanja

GitHub Copilot CLI dobio automatski odabir modela: 10 % popust na multiplikatore za sve plaćene korisnike

Editorial ilustracija: terminal s grananjem strelica prema različitim AI modelima u automatskom rutiranju

GitHub je 17. travnja 2026. objavio da je automatski odabir AI modela u Copilot CLI alatu postao općenito dostupan za sve Copilot planove. Sustav dinamički rutira upite na modele kao što su GPT-5.4, GPT-5.3-Codex, Sonnet 4.6 i Haiku 4.5 ovisno o pravilima administratora. Plaćeni korisnici dobivaju 10 % popust na model multiplikator kada koriste auto način — model s 1x multiplikatorom umjesto 1 premium request troši 0,9.

🟡 🏥 U praksi 18. travnja 2026. · 4 min čitanja

PyTorch i Meta: preko 90 posto efektivnog training vremena kroz 40+ optimizacija, MegaCache smanjuje PT2 kompilaciju za 40 posto

Meta je objavila kako je postigla preko 90 posto Effective Training Time (ETT) za offline trening svojih recommendation modela. Metoda uključuje više od 40 novih optimizacija u PyTorch ekosustavu, MegaCache koji smanjuje vrijeme PT2 kompilacije za 40 posto, standalone model publishing koji štedi 30 minuta po poslu, i async checkpointing. Poboljšanja su open-sourceana kroz PyTorch i TorchRec.

🟢 🏥 U praksi 18. travnja 2026. · 3 min čitanja

AWS uvodi granularnu atribuciju troškova za Amazon Bedrock po IAM principalima

Amazon Bedrock sada prati troškove inferencije po IAM principalu — specifičnom korisniku, roli ili federiranom identitetu koji poziva API. Značajka se integrira s AWS Cost and Usage Reports (CUR 2.0) i Cost Explorerom bez dodatne naplate. Podržava četiri scenarija pristupa: direktni IAM korisnici, aplikacijske uloge, federalne autentikacije i LLM gateway proxy obrasci. Dostupno u svim komercijalnim AWS regijama.

💬 Zajednica (1)

🟢 💬 Zajednica 18. travnja 2026. · 3 min čitanja

Apple na ICLR 2026 u Riju: preko 40 postera, MLX demo na iPad Pro, SHARP 3D generacija i MANZANO unified model

Apple ML je objavio pregled istraživanja koja predstavlja na ICLR 2026 konferenciji u Rio de Janeiru od 23. do 27. travnja 2026. Tvrtka sponzorira konferenciju i ima booth 204 gdje demonstrira local LLM inference na Apple siliconu kroz MLX framework i SHARP 3D model na iPad Pro. Prezentira se više od 40 postera i oralna prezentacija 'To Infinity and Beyond — Tool-Use Unlocks Length Generalization'.

← Prethodni dan Sljedeći dan →