🟡 🏥 U praksi Objavljeno: · 3 min čitanja ·

IBM: Red Hat AI Inference i OpenShift Virtualization Service objavljeni kao managed proizvodi na IBM Cloud-u

Editorial illustration: enterprise cloud infrastructure with red and blue glow, abstract servers running inference workloads, hybrid VM and container orchestration.

IBM je danas najavio Red Hat AI Inference Service i Red Hat OpenShift Virtualization Service kao managed enterprise proizvode dostupne na IBM Cloud-u. Prvi nudi optimizirano serving okruženje za open-source LLM-ove (Granite, Llama, Mistral) s automatskim scaling-om i SLA jamstvima, drugi omogućuje pokretanje VM-ova i kontejnera u istoj OpenShift kontrolnoj ravnini. Cilj: reducirati operativni teret enterprise tima koji žele open-source AI bez vlastite Kubernetes infrastrukture.

🤖

Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.

Što IBM točno objavljuje danas?

IBM je u sklopu Think 2026 događaja u Bostonu objavio dva managed proizvoda na IBM Cloud-u. Prvi je Red Hat AI Inference Service — managed inference endpoint za open-source LLM-ove. Drugi je Red Hat OpenShift Virtualization Service — managed proizvod koji omogućuje pokretanje tradicionalnih virtualnih strojeva (KVM) zajedno s kontejnerima unutar iste OpenShift kontrolne ravnine. Oba proizvoda su odgovor na zahtjeve enterprise tima koji žele moderan AI stack, ali nemaju kapacitet izgraditi i održavati vlastitu Kubernetes infrastrukturu.

Razlog zašto je ovo važno: open-source LLM serving je u praksi netrivijalan. Tim koji želi pokretati Llama 4 ili Granite 4.1 lokalno mora odabrati framework (vLLM, TGI, SGLang), provisionirati GPU-ove (A100, H100, H200), konfigurirati auto-scaling, riješiti load balancing, multi-tenant izolaciju, observability. IBM ovo cijelo skup obvezuje pod jednim managed proizvodom — kupac dobiva REST endpoint i SLA, ne brigu o GPU node failoveru.

Kako Red Hat AI Inference Service funkcionira?

Tehnički, Red Hat AI Inference koristi vLLM kao engine ispod hood-a, s IBM-ovim layer-om za multi-tenant routing i quota management. Model katalog uključuje IBM Granite 4.1 (objavljen prošli mjesec), Meta Llama 4, Mistral Large 2, IBM-ov OpenShift AI fine-tuned modeli. Cijena: per-token za “shared” tier (slično OpenAI/Anthropic API-ju) ili per-GPU-hour za “dedicated” tier (predvidljiviji trošak za workloadove s konstantnim QPS-om).

OpenShift Virtualization Service paralelno rješava drugi problem: enterprise tim ima legacy aplikacije (Java EE, baze podataka) koje žive u VM-ovima, ali žele postupnu migraciju u kontejnere. Pokretanjem oba radnog opterećenja u istoj kontrolnoj ravnini, network policies, RBAC i observability se konsolidiraju.

Zašto IBM ovo objavljuje sada?

Timing je strateški. AWS je jučer (11.05.) objavio Claude Platform GA — AWS account postaje single onboarding point za Anthropic stack. Google je u travnju objavio Gemini Enterprise s lokalnom data residency u 12 zemalja. IBM-ova prednost u ovoj utrci je open-source orijentacija (modeli koji se mogu hostati i on-premise) i enterprise-grade compliance (FedRAMP High, HIPAA, EU data residency u Frankfurtu/Madridu).

Za enterprise CIO koji ocjenjuje “build vs buy” za AI infrastrukturu, IBM-ova ponuda popunjava specifičnu nišu: tim koji već koristi OpenShift on-prem može sad pokrenuti AI workloadove na IBM Cloud-u s istom orchestracijom, i postupno migrirati VM-ove. Ovo je defenzivni potez protiv hyperscaler-a koji nude konkretne AI proizvode ali zahtijevaju da kupac “live u njihovom ekosustavu”.

Što ovo znači za Red Hat-ove kupce izvan IBM Cloud-a?

Red Hat OpenShift AI (predhodni naziv: OpenShift Data Science) i dalje je dostupan kao samostalan proizvod koji enterprise tim može deploy-ati na AWS, Azure, GCP ili on-premise. IBM-ovi managed servisi nisu zamjena, već optimizacija za kupce koji već koriste IBM Cloud ili žele potpuno managed iskustvo. Tehnologija ispod (vLLM, Granite modeli, OpenShift Virtualization) ostaje open-source, što štiti vendor lock-in zabrinutost — kupac može migrirati na drugi cloud zadržavajući isti stack.

Česta pitanja

Što je Red Hat AI Inference Service?
Red Hat AI Inference Service je managed inference platforma za open-source LLM-ove. IBM Cloud preuzima brigu o GPU provisioning-u, model loading-u, auto-scalingu i monitoringu — kupac plaća per-token ili per-replica. Podržani modeli: IBM Granite obitelj, Meta Llama, Mistral, i custom fine-tuned varijante.
Tko su konkurenti ovom proizvodu?
Direktni konkurenti su AWS Bedrock (Anthropic Claude, Mistral, Llama hosting), Azure AI Foundry (OpenAI + open-source), Google Vertex AI Model Garden. IBM-ov diferencijator: jača enterprise integracija s postojećim Red Hat OpenShift okolinama, lokalna data residency, i partnership s NVIDIA-om za GPU dostupnost.