🤖 24 AI

Subota, 18. travnja 2026.

13 vijesti — 🔴 2 kritično , 🟡 7 važno , 🟢 4 zanimljivo

← Prethodni dan Sljedeći dan →

🤖 Modeli (4)

🟡 🤖 Modeli 18. travnja 2026. · 3 min čitanja

AWS Nova destilacija za video semantičku pretragu: 95 posto uštede i dvostruko brži inference

AWS je demonstrirao kako model distillation prebacuje inteligenciju velikog Nova Premier modela u manji Nova Micro za video search routing. Rezultati su 95 posto ušteda na troškovima inferencija, 50 posto manja latencija (833 ms umjesto 1741 ms) i zadržana kvaliteta po LLM-as-judge ocjeni (4,0 od 5). Cijeli trening koristio je 10000 sintetičkih primjera generiranih iz Nova Premiera.

🟡 🤖 Modeli 18. travnja 2026. · 4 min čitanja

AWS Nova Multimodal Embeddings za video pretragu: hibridni pristup donosi 90 posto recalla umjesto 51 posto

AWS Nova Multimodal Embeddings su nova arhitektura koja istovremeno obrađuje vizualni, audio i tekstualni sadržaj videa u zajednički 1024-dimenzionalni vektorski prostor bez pretvaranja u tekst. Kombinacija semantičkog embeddinga s BM25 leksičkom pretragom daje 90 posto Recall@5, u odnosu na 51 posto za baseline combined-mode embeddinge — skok od 30 do 40 postotnih bodova na svim mjerama.

🟡 🤖 Modeli 18. travnja 2026. · 4 min čitanja

NVIDIA Nemotron OCR v2: 34,7 stranica u sekundi, pet jezika u jednom modelu, 28 puta brže od PaddleOCR

NVIDIA je na HuggingFaceu objavila Nemotron OCR v2, multilingvalni OCR model koji obrađuje 34,7 stranica u sekundi na jednom A100 GPU-u. To je 28 puta brže od PaddleOCR v5. Model podržava engleski, kineski, japanski, korejski i ruski u jedinstvenoj arhitekturi, bez potrebe za detekcijom jezika. Treniran na 12,2 milijuna sintetičkih slika, model i dataset su dostupni pod NVIDIA Open Model licencom i CC-BY-4.0.

🟢 🤖 Modeli 18. travnja 2026. · 3 min čitanja

ArXiv AC/DC: automatsko otkrivanje specijaliziranih LLM-ova kroz koevoluciju modela i zadataka

AC/DC je novi framework prezentiran na ICLR 2026 koji istovremeno evoluira LLM modele kroz model merging i zadatke kroz sintetičke podatke. Otkrivene populacije modela demonstriraju širu pokrivenost ekspertize od ručno kurirani modela bez eksplicitne optimizacije za benchmarke. Modeli nadmašuju veće pandane uz manju GPU memoriju, što predstavlja novi paradigm u kontinuiranom razvoju LLM-a.

📦 Open Source (1)

🤝 Agenti (2)

🏥 U praksi (5)

🔴 🏥 U praksi 18. travnja 2026. · 3 min čitanja

Anthropic Claude Design: vizualni suradnik pogonjen Claude Opus 4.7 za dizajn, prezentacije i prototipove

Claude Design je novi Anthropic Labs proizvod koji pretvara Claude Opus 4.7 u kolaborativni alat za vizualno kreiranje — dizajne, prototipove, prezentacije, one-pagere. Sustav automatski čita design sustav iz codebasea i design datoteka, podržava inline komentare i slidere za podešavanje, te ima direktni handoff prema Claude Codeu za implementaciju. Dostupan u research preview-u za Pro, Max, Team i Enterprise pretplatnike od 17. travnja 2026.

🟡 🏥 U praksi 18. travnja 2026. · 3 min čitanja

Anthropic: infrastrukturni šum mijenja rezultate agentskih benchmarka do 6 postotnih bodova

Istraživači u Anthropicu dokazali su da konfiguracija RAM-a i CPU headrooma može promijeniti rezultate agentskih coding benchmarka za 6 postotnih bodova — više nego što je razlika između top modela na leaderboardu. Testirali su Terminal-Bench 2.0 i SWE-bench. Preporuka: prednosti ispod 3 postotna boda zaslužuju skepticizam dok se eval konfiguracija ne dokumentira i uskladi.

🟡 🏥 U praksi 18. travnja 2026. · 2 min čitanja

GitHub Copilot CLI dobio automatski odabir modela: 10 % popust na multiplikatore za sve plaćene korisnike

Editorial ilustracija: terminal s grananjem strelica prema različitim AI modelima u automatskom rutiranju

GitHub je 17. travnja 2026. objavio da je automatski odabir AI modela u Copilot CLI alatu postao općenito dostupan za sve Copilot planove. Sustav dinamički rutira upite na modele kao što su GPT-5.4, GPT-5.3-Codex, Sonnet 4.6 i Haiku 4.5 ovisno o pravilima administratora. Plaćeni korisnici dobivaju 10 % popust na model multiplikator kada koriste auto način — model s 1x multiplikatorom umjesto 1 premium request troši 0,9.

🟡 🏥 U praksi 18. travnja 2026. · 4 min čitanja

PyTorch i Meta: preko 90 posto efektivnog training vremena kroz 40+ optimizacija, MegaCache smanjuje PT2 kompilaciju za 40 posto

Meta je objavila kako je postigla preko 90 posto Effective Training Time (ETT) za offline trening svojih recommendation modela. Metoda uključuje više od 40 novih optimizacija u PyTorch ekosustavu, MegaCache koji smanjuje vrijeme PT2 kompilacije za 40 posto, standalone model publishing koji štedi 30 minuta po poslu, i async checkpointing. Poboljšanja su open-sourceana kroz PyTorch i TorchRec.

🟢 🏥 U praksi 18. travnja 2026. · 3 min čitanja

AWS uvodi granularnu atribuciju troškova za Amazon Bedrock po IAM principalima

Amazon Bedrock sada prati troškove inferencije po IAM principalu — specifičnom korisniku, roli ili federiranom identitetu koji poziva API. Značajka se integrira s AWS Cost and Usage Reports (CUR 2.0) i Cost Explorerom bez dodatne naplate. Podržava četiri scenarija pristupa: direktni IAM korisnici, aplikacijske uloge, federalne autentikacije i LLM gateway proxy obrasci. Dostupno u svim komercijalnim AWS regijama.

💬 Zajednica (1)

← Prethodni dan Sljedeći dan →