🔧 Hardware

9 vijesti

🟢 🔧 Hardware 25. travnja 2026. · 2 min čitanja

AMD Primus Projection: alat za predviđanje memorije i brzine treninga LLM-ova prije pokretanja na Instinct GPU klasterima

Editorial illustration: AMD Primus Projection — predviđanje LLM treninga

AMD Primus Projection je alat koji prije pokretanja treninga LLM-a na Instinct GPU klasterima predviđa memorijske zahtjeve i propusnost. Koristi analitičke formule uz stvarni GPU benchmark, a projekcije su unutar ~10 % izmjerenih rezultata na MI325X i MI355X akceleratorima za Llama i Mixtral modele.

🟢 🔧 Hardware 24. travnja 2026. · 3 min čitanja

Google na Cloud Next '26 predstavio TPU 8i i TPU 8t: specijalizirani čipovi za agentno AI računarstvo

Editorial illustration: Google TPU 8i i 8t — specijalizirani AI čipovi

Google je na konferenciji Cloud Next '26 predstavio dvije nove generacije TPU čipova: TPU 8i za inferenciju AI agenata i TPU 8t za trening najsloženijih modela. Potez formalizira podjelu Googleove TPU linije na dvije specijalizirane grane unutar 'agentne ere' računarstva.

🟡 🔧 Hardware 23. travnja 2026. · 2 min čitanja

NVIDIA i Google Cloud najavili suradnju za agentic AI i physical AI na zajedničkoj infrastrukturi

Editorial illustration: AI čip — hardware

NVIDIA i Google Cloud objavili su zajedničku suradnju za ubrzavanje agentic AI i physical AI radnih opterećenja, kombinirajući NVIDIA GPU infrastrukturu s Google Cloud platformom za robotiku, autonomne sustave i agente.

🟢 🔧 Hardware 23. travnja 2026. · 2 min čitanja

Gemma 4 pokrenut kao Vision Language Agent lokalno na Jetson Orin Nano Super

Editorial illustration: AI čip — hardware

NVIDIA i HuggingFace demonstrirali su Gemma 4 kao Vision Language Agent koji autonomno odlučuje o korištenju kamere i cijelu pipeline obradu, uključujući speech-to-text i TTS, izvodi lokalno na NVIDIA Jetson Orin Nano Super s 8 GB memorije, bez cloud ovisnosti.

🔴 🔧 Hardware 22. travnja 2026. · 3 min čitanja

Google predstavio 8. generaciju TPU čipova: dvije specijalizirane varijante za agentic AI eru

Editorial ilustracija: Dva specijalizirana TPU cipa 8. generacije za treniranje i inferenciju agentic AI workloada

Google je na Cloud Next '26 konferenciji predstavio osmu generaciju svojih TPU čipova u dvije specijalizirane varijante — TPU 8t za treniranje modela i TPU 8i za agentic inference. Prva je to generacija posebno dizajnirana za autonomne AI agente i multi-step rezoniranje.

🟡 🔧 Hardware 21. travnja 2026. · 3 min čitanja

AWS G7e Blackwell instance: Qwen3-32B na SageMakeru za $0,41 po milijunu tokena — 4× jeftiniji inference

Editorial ilustracija podatkovnog centra s NVIDIA Blackwell GPU-ima i GDDR7 memorijskim modulima

AWS G7e instance su nove SageMaker GPU instance s NVIDIA RTX PRO 6000 Blackwell čipom i 96 GB GDDR7 memorije koje donose do 2,3× bolji inference od G6e generacije. Trošak za Qwen3-32B pada s $2,06 na $0,79 po milijunu output tokena, a uz EAGLE spekulativno dekodiranje i do $0,41.

🟡 🔧 Hardware 16. travnja 2026. · 2 min čitanja

AWS: Speculative decoding na Trainium čipovima ubrzava LLM inference do 3 puta

Amazon Web Services objavio je detaljnu implementaciju speculative decodinga na AWS Trainium čipovima u kombinaciji s vLLM frameworkom, postižući do 3 puta brže generiranje tokena za decode-heavy radne zadatke. Tehnika koristi manji draft model koji predviđa sljedećih N tokena, a veći target model ih verificira u jednom prolazu, eliminirajući usko grlo sekvencijalnog generiranja.

🟢 🔧 Hardware 16. travnja 2026. · 2 min čitanja

NVIDIA: Blackwell generira tokene 35 puta jeftinije od Hoppera — cijena po tokenu jedina je metrika

NVIDIA je objavila analizu koja argumentira da je cijena po tokenu jedina relevantna metrika za AI infrastrukturu. Usporedba Blackwell i Hopper generacije pokazuje da Blackwell košta dva puta više po GPU satu, ali generira 65 puta više tokena u sekundi, rezultirajući 35 puta nižom cijenom po milijunu tokena — 0,12 dolara nasuprot 4,20 dolara za Hopper.

🟡 🔧 Hardware 10. travnja 2026. · 2 min čitanja

NVIDIA na National Robotics Weeku predstavila RoboLab benchmark i novi val physical AI projekata

NVIDIA je u sklopu National Robotics Weeka 2026. predstavila niz novih projekata physical AI-a, uključujući RoboLab — benchmark za simulation-to-reality transfer, suradnje s Toyota Research Institute, Mimic Robotics i Doosan Robotics, te otvorene resurse za robotske policy evaluation poput Isaac Lab-Arene.