📦 Open Source

15 vijesti

🟡 📦 Open Source 28. travnja 2026. · 3 min čitanja

OpenAI objavio Privacy Filter: 1.5B parametara, Apache 2.0 licenca, 128K kontekst i state-of-the-art detekcija osmero kategorija PII-a u jednom prolazu

Stilizirani prikaz dokumenta čiji se osjetljivi dijelovi automatski sakrivaju kroz softverski filter, predstavljen apstraktnim slojevima i oznakama kategorija.

OpenAI je objavio Privacy Filter — open-source detektor osobno identifikacijskih podataka s 1.5 milijardi parametara (50M aktivnih), 128.000 token kontekstom i Apache 2.0 licencom. Detektira osam PII kategorija u jednom prolazu i postiže state-of-the-art rezultate na PII-Masking-300k benchmarku, s podrškom za više jezika.

🟢 📦 Open Source 28. travnja 2026. · 4 min čitanja

ONNX v1.21.0 izlazi s Opset 26: novi CumProd i BitCast operatori, podrška za 2-bitne tipove i Python 3.14 free-threading eksperiment

Apstraktna ilustracija slojevitog neuronskog grafa s istaknutim novim operatorima i numeričkim oznakama 2-bitnih tenzora kao simbol verzije Opset 26.

Linux Foundation AI & Data Foundation objavila je 27. travnja 2026. ONNX v1.21.0 — uvodi Opset 26 s operatorima CumProd i BitCast, podršku za 2-bitne tipove, eksperimentalno Python 3.14 free-threading, te poboljšanja konzistentnosti integer dijeljenja i sigurnosti kompajlera.

🟡 📦 Open Source 24. travnja 2026. · 3 min čitanja

Google DeepMind Decoupled DiLoCo: 20× manja mrežna propusnost za AI trening kroz geografski razdvojene datacentre

Editorial illustration: Open-source alat — open-source

Google DeepMind je predstavio Decoupled DiLoCo, distribuiranu arhitekturu za trening AI modela. Smanjuje potrebnu mrežnu propusnost s 198 Gbps na 0,84 Gbps između 8 datacentara i postiže 88% goodputa u usporedbi s 27% kod konvencionalnih metoda.

🟡 📦 Open Source 24. travnja 2026. · 3 min čitanja

vLLM uveo DeepSeek V4 s 8,7× manjim KV cacheom: milijun tokena konteksta na standardnom GPU hardveru

Editorial illustration: vLLM DeepSeek V4 kompresija — KV cache moduli

vLLM je istoga dana kad i DeepSeek objavio integraciju V4-Pro i V4-Flash modela, uz 8,7× manji KV cache u odnosu na V3.2 pri milijun tokena konteksta. Kombinacija sparse attention-a i agresivne kompresije omogućuje serving na standardnom GPU hardveru.

🟢 📦 Open Source 24. travnja 2026. · 2 min čitanja

Allen AI: OlmoEarth embeddings omogućuju segmentaciju krajobraza s tek 60 piksela i F1 rezultatom 0,84

Editorial illustration: Open-source alat — open-source

Allen Institute for AI lansirao je OlmoEarth Studio s tri veličine modela (Nano, Tiny, Base) za satelitske embeddings. Modeli postižu F1 rezultat 0,84 za segmentaciju krajobraza s tek 60 označenih piksela te podržavaju detekciju promjena i PCA vizualizaciju.

🟡 📦 Open Source 23. travnja 2026. · 2 min čitanja

Apple na ICLR 2026 predstavlja ParaRNN: paralelno treniranje nelinearnih RNN-ova uz 665× ubrzanje

Editorial illustration: Open-source alat — open-source

Apple je na konferenciji ICLR 2026 u Rio de Janeiru predstavio pet istraživačkih radova, a najistaknutiji je ParaRNN — metoda koja omogućuje paralelno treniranje nelinearnih rekurentnih neuronskih mreža i postiže 665 puta veće ubrzanje od sekvencijalnog pristupa, skalirajući RNN-ove na milijarde parametara kompetitivno s transformerima.

🟡 📦 Open Source 23. travnja 2026. · 2 min čitanja

Linux Foundation objavio RGAF vodič s 35 open-source alata za odgovoran AI

Editorial illustration: Open-source alat — open-source

Linux Foundation AI & Data objavio je praktični vodič za implementaciju RGAF (Responsible Generative AI Framework) kroz devet dimenzija odgovornog AI-a, s katalogom od 35 konkretnih open-source alata i usklađenošću s NIST AI RMF, EU AI Aktom, ISO/IEC 42001 i OECD načelima.

🟢 📦 Open Source 22. travnja 2026. · 2 min čitanja

WorldDB: memorijski engine koji spaja vektorsku bazu i graf svjetova za AI agente

Editorial ilustracija: Vektorska baza podataka i graf cvorova povezani ontologijom u memoriji agenata

WorldDB je novi memorijski engine za AI agente koji kombinira vektorsku bazu s grafom ugniježđenih svjetova i ontologijom. Usklađuje znanje u trenutku pisanja i sprečava kontradikcije u agentnoj memoriji, postižući 96,40% točnosti na LongMemEval-s benchmark-u.

🟡 📦 Open Source 21. travnja 2026. · 3 min čitanja

Allen Institute BAR: modularno post-treniranje s mixture-of-experts donosi +7,8 poena za matematiku na OLMo 2 7B

Editorial ilustracija modularnog MoE sustava s router komponentom koja delegira upite različitim ekspertima

BAR (Branch-Adapt-Route) je novi modularni pristup post-treniranju iz Allen Institute for AI koji omogućuje nezavisno treniranje domain eksperata — matematika, kod, tool use, sigurnost — i njihovo spajanje u unified mixture-of-experts model. Rezultati na OLMo 2 7B: 49,1 prosječni skor, +7,8 poena za matematiku i +4,7 za kod nad baseline retrainingom.

🟡 📦 Open Source 21. travnja 2026. · 3 min čitanja

AMD FLy: training-free spekulativno dekodiranje donosi 5,21× ubrzanje na Llama-3.3-405B uz točnost preko 99 %

Editorial ilustracija spekulativnog dekodiranja — draft model predlaže tokene, target model ih paralelno provjerava

AMD FLy je nova training-free metoda spekulativnog dekodiranja koja semantičkim prihvaćanjem draft tokena postiže 4,80× do 5,21× ubrzanje na Llama-3.3-405B i 2,74× na Llama-3.1-70B uz točnost iznad 99 %, bez potrebe za dodatnom obukom modela.

🔴 📦 Open Source 18. travnja 2026. · 3 min čitanja

Google Gemma 4: četiri otvorena modela, 31B dense na trećem mjestu Arene, Apache 2.0 licenca

Gemma 4 je Googleova nova generacija otvorenih modela u četiri varijante: E2B za mobitele, E4B za edge uređaje, 26B MoE s 3,8 milijarde aktivnih parametara i 31B dense. 31B drži treće mjesto na Arena ljestvici otvorenih modela i navodno nadmašuje modele 20 puta veće, a 26B MoE je šesti. Svi modeli su multimodalni (tekst, slika, video, audio), podržavaju 140 jezika, imaju kontekst do 256K tokena i puštaju se pod Apache 2.0 licencom.

🟢 📦 Open Source 17. travnja 2026. · 2 min čitanja

HuggingFace: vodič za trening multimodalnih embedding i reranker modela

HuggingFace je objavio detaljni vodič za fine-tuning multimodalnih embedding i reranker modela kroz Sentence Transformers biblioteku. Fokus je na spajanju teksta i slike u zajednički embedding prostor što omogućuje semantičko pretraživanje kroz heterogene podatke. Primjena je primarno u RAG sustavima koji rade s mješavinom dokumenata, tablica, slika i skenova.

🟢 📦 Open Source 17. travnja 2026. · 2 min čitanja

HuggingFace: Transformers-to-MLX skill za Claude Code donosi AI-assisted portanje modela na Apple Silicon

HuggingFace je objavio Transformers-to-MLX skill od 15.000 riječi koji koristi Claude Code za portanje Transformers modela na MLX-LM platformu za Apple Silicon. Skill uključuje test harness koji neovisno verificira rezultate eliminirajući problem LLM halucinacija, a rješava rastući izazov open-source projekata gdje AI agenti povećavaju volumen pull requestova 10 puta.

🟢 📦 Open Source 16. travnja 2026. · 2 min čitanja

LangChain: Kako smo natjerali dokumentaciju da testira samu sebe pomoću Deep Agenata

LangChain je izgradio automatizirani sustav za testiranje dokumentacije korištenjem Deep Agenata koji sprječava zastarjele primjere koda u dokumentaciji. Sustav koristi višestruke vještine (skills) koje migriraju inline kodne isječke u samostalne test datoteke, pokreću ih kroz GitHub Actions i regeneriraju verificirane isječke, osiguravajući da dokumentacija uvijek odražava stvarno stanje API-ja.

🟡 📦 Open Source 10. travnja 2026. · 2 min čitanja

Waypoint-1.5: AI generira interaktivne 720p svjetove na običnom RTX-u 3090

Overworld je objavio Waypoint-1.5, real-time video world model koji generira interaktivne virtualne okoline u rezoluciji 720p/60fps na consumer GPU-ima poput RTX 3090 i Apple Silicon Maca. Model je treniran na ~100x više podataka od prethodne verzije i dostupan je open source na HuggingFaceu.