IBM: Red Hat AI InferenceをCloud上に提供

IBMは本日、Red Hat AI Inference ServiceとRed Hat OpenShift Virtualization ServiceをIBM Cloud上のマネージドエンタープライズ製品として発表しました。前者はオープンソースLLM（Granite、Llama、Mistral）向けに最適化されたサービング環境を自動スケーリングとSLA保証付きで提供し、後者は同じOpenShiftコントロールプレーン内でVMとコンテナの実行を可能にします。目的：独自のKubernetesインフラなしにオープンソースAIを使用したい企業チームの運用負荷を削減することです。

IBMは本日具体的に何を発表しましたか？

IBMはボストンで開催されたThink 2026イベントで、IBM Cloud上の2つのマネージド製品を発表しました。最初はRed Hat AI Inference Service——オープンソース LLM向けのマネージド推論エンドポイントです。2番目はRed Hat OpenShift Virtualization Service——同じOpenShiftコントロールプレーン内でコンテナと一緒に従来の仮想マシン（KVM）を実行できるマネージド製品です。どちらの製品も、モダンなAIスタックを望むものの、独自のKubernetesインフラを構築・維持する能力を持たない企業チームの要求への回答です。

これが重要な理由：オープンソースLLMのサービングは実際には簡単ではありません。Llama 4またはGranite 4.1をローカルで実行したいチームは、フレームワーク（vLLM、TGI、SGLang）を選択し、GPU（A100、H100、H200）をプロビジョニングし、オートスケーリングを設定し、ロードバランシング、マルチテナント分離、可観測性の問題を解決する必要があります。IBMはこの複雑な作業全体を1つのマネージド製品にまとめています——顧客はRESTエンドポイントとSLAを受け取り、GPUノードのフェイルオーバーを心配する必要はありません。

Red Hat AI Inference Serviceはどのように機能しますか？

技術的には、Red Hat AI Inferenceは内部でvLLMをエンジンとして使用しており、IBMがマルチテナントルーティングとクォータ管理のレイヤーを追加しています。モデルカタログにはIBM Granite 4.1（先月発表）、Meta Llama 4、Mistral Large 2、IBMのOpenShift AIファインチューニングモデルが含まれます。価格：「共有」ティアはトークン単位（OpenAI/Anthropic APIと同様）、「専用」ティアはGPU時間単位（一定のQPSを持つワークロードに対してより予測可能なコスト）。

OpenShift Virtualization Serviceは同時に別の問題を解決します：企業チームはVMに存在するレガシーアプリケーション（Java EE、データベース）を持ちながら、コンテナへの段階的な移行を望んでいます。同じコントロールプレーンで両方のワークロードを実行することで、ネットワークポリシー、RBAC、可観測性が統合されます。

IBMはなぜ今これを発表するのですか？

タイミングは戦略的です。AWSは昨日（5月11日）Claude Platform GAを発表しました——AWSアカウントがAnthropicスタックの単一オンボーディングポイントになります。Googleは4月に12カ国でローカルデータレジデンシーを持つGemini Enterpriseを発表しました。IBMのこの競争における優位性は、オープンソース志向（オンプレミスでもホスティング可能なモデル）とエンタープライズグレードのコンプライアンス（FedRAMP High、HIPAA、フランクフルト/マドリードのEUデータレジデンシー）です。

AI インフラの「ビルドvsバイ」を評価する企業CIOにとって、IBMの提供は特定のニッチを埋めます：すでにオンプレミスでOpenShiftを使用しているチームは、同じオーケストレーションでIBM Cloud上でAIワークロードを実行し、VMを段階的に移行できるようになります。これは、具体的なAI製品を提供するものの、顧客に「自社エコシステムで生活する」ことを要求するハイパースケーラーに対する守りの手です。

これはIBM Cloud以外のRed Hat顧客にとって何を意味しますか？

Red Hat OpenShift AI（前名：OpenShift Data Science）は引き続き、企業チームがAWS、Azure、GCP、またはオンプレミスにデプロイできる独立した製品として利用可能です。IBMのマネージドサービスは代替品ではなく、すでにIBM Cloudを使用しているか、完全なマネージド体験を望む顧客向けの最適化です。基盤となる技術（vLLM、Graniteモデル、OpenShift Virtualization）はオープンソースのままであり、ベンダーロックインの懸念を払拭します——顧客は同じスタックを維持しながら別のクラウドに移行できます。

よくある質問

Red Hat AI Inference Serviceとは何ですか？

Red Hat AI Inference Serviceはオープンソース LLM向けのマネージド推論プラットフォームです。IBM CloudがGPUプロビジョニング、モデルのロード、オートスケーリング、モニタリングを担当します——顧客はトークン単位またはレプリカ単位で支払います。対応モデル：IBM Graniteファミリー、Meta Llama、Mistral、カスタムファインチューニングバリアント。

この製品の競合他社はどこですか？

直接の競合他社はAWS Bedrock（Anthropic Claude、Mistral、Llamaホスティング）、Azure AI Foundry（OpenAI+オープンソース）、Google Vertex AI Model Gardenです。IBMの差別化要因：既存のRed Hat OpenShift環境とのより強力なエンタープライズ統合、ローカルデータレジデンシー、およびGPU可用性に関するNVIDIAとのパートナーシップ。

IBM: Red Hat AI InferenceとOpenShift Virtualization ServiceがIBM Cloudでマネージド製品として発表

IBMは本日具体的に何を発表しましたか？

Red Hat AI Inference Serviceはどのように機能しますか？

IBMはなぜ今これを発表するのですか？

これはIBM Cloud以外のRed Hat顧客にとって何を意味しますか？

よくある質問

出典

関連ニュース