IBM: Red Hat AI Inference和OpenShift Virtualization Service作为托管产品在IBM Cloud上发布
IBM今天宣布将Red Hat AI Inference Service和Red Hat OpenShift Virtualization Service作为托管企业产品在IBM Cloud上提供。前者为开源LLM(Granite、Llama、Mistral)提供优化的服务环境,具备自动扩展和SLA保障;后者允许在同一OpenShift控制平面中运行虚拟机和容器。目标:降低希望使用开源AI但不具备自有Kubernetes基础设施能力的企业团队的运营负担。
本文由人工智能基于一手来源生成。
IBM今天具体宣布了什么?
IBM在波士顿举行的Think 2026活动上宣布了IBM Cloud上的两款托管产品。第一款是Red Hat AI Inference Service——面向开源LLM的托管推理端点。第二款是Red Hat OpenShift Virtualization Service——一款托管产品,允许在同一OpenShift控制平面内将传统虚拟机(KVM)与容器一起运行。这两款产品都是对希望使用现代AI技术栈但没有能力构建和维护自有Kubernetes基础设施的企业团队需求的回应。
为何这一点很重要:开源LLM服务在实践中并不简单。希望在本地运行Llama 4或Granite 4.1的团队必须选择框架(vLLM、TGI、SGLang)、配置GPU(A100、H100、H200)、配置自动扩展、解决负载均衡、多租户隔离和可观测性问题。IBM将整个复杂工作集中在一个托管产品下——客户获得REST端点和SLA,而无需担心GPU节点故障转移。
Red Hat AI Inference Service如何运作?
从技术层面来看,Red Hat AI Inference在底层使用vLLM作为引擎,IBM在其上添加了多租户路由和配额管理层。模型目录包括IBM Granite 4.1(上个月发布)、Meta Llama 4、Mistral Large 2以及IBM的OpenShift AI微调模型。定价:「共享」层按令牌计费(类似于OpenAI/Anthropic API),「专用」层按GPU小时计费(对于具有恒定QPS的工作负载,成本更可预测)。
OpenShift Virtualization Service同时解决了另一个问题:企业团队拥有生活在虚拟机中的遗留应用程序(Java EE、数据库),但希望逐步迁移到容器。通过在同一控制平面中运行这两种工作负载,网络策略、RBAC和可观测性得以整合。
IBM为何选择现在宣布这一消息?
时机具有战略意义。AWS昨天(5月11日)宣布了Claude Platform GA——AWS账户成为Anthropic技术栈的单一入驻点。Google在四月宣布了在12个国家具备本地数据驻留的Gemini Enterprise。IBM在这场竞争中的优势是开源导向(可本地托管的模型)和企业级合规性(FedRAMP High、HIPAA、法兰克福/马德里的EU数据驻留)。
对于评估AI基础设施「自建vs购买」的企业CIO而言,IBM的产品填补了特定空白:已在本地使用OpenShift的团队现在可以使用相同的编排方式在IBM Cloud上运行AI工作负载,并逐步迁移虚拟机。这是对超大规模提供商的防御性举措,后者提供具体的AI产品但要求客户「生活在其生态系统中」。
这对IBM Cloud以外的Red Hat客户意味着什么?
Red Hat OpenShift AI(前名:OpenShift Data Science)仍作为独立产品提供,企业团队可以在AWS、Azure、GCP或本地部署。IBM的托管服务并非替代品,而是为已经使用IBM Cloud或希望完全托管体验的客户提供的优化方案。底层技术(vLLM、Granite模型、OpenShift Virtualization)保持开源,这消除了供应商锁定的担忧——客户可以在保留相同技术栈的情况下迁移到其他云。
常见问题
- 什么是Red Hat AI Inference Service?
- Red Hat AI Inference Service是面向开源LLM的托管推理平台。IBM Cloud负责GPU配置、模型加载、自动扩展和监控——客户按令牌或按副本付费。支持的模型:IBM Granite系列、Meta Llama、Mistral以及自定义微调变体。
- 该产品的竞争对手有哪些?
- 直接竞争对手包括AWS Bedrock(Anthropic Claude、Mistral、Llama托管)、Azure AI Foundry(OpenAI+开源)、Google Vertex AI Model Garden。IBM的差异化优势:与现有Red Hat OpenShift环境更强的企业集成、本地数据驻留以及与NVIDIA的GPU可用性合作关系。