🟡 🏥 実践 公開日: · 2 分で読めます ·

AWS:SageMaker AIにOpenAI互換APIエンドポイントが登場

Editorial illustration: AWS SageMaker AIのOpenAI互換APIエンドポイント、自社GPUインフラへのドロップイン置き換えを実現

AWSは2026年5月20日、Amazon SageMaker AIのリアルタイム推論エンドポイントがOpenAI互換APIを提供するようになったと発表しました。OpenAI SDK、LangChain、Strands Agentsのドロップイン置き換えとしてURL変更のみで移行可能です。エンドポイントは/openai/v1パスでChat Completionsとストリーミングをサポートし、認証はAWS認証情報から生成された時間制限付きBearerトークンを使用します。

🤖

この記事はAIにより一次情報源から生成されました。

AWSは2026年5月20日Amazon SageMaker AIのリアルタイム推論エンドポイントでOpenAI互換APIが利用できるようになったと発表しました。OpenAI Python SDKLangChainAWS Strands Agents、またはOpenAI API互換ライブラリで作られたアプリケーションは、base_urlとAPIキーを変更するだけでSageMakerに移行できます——コードの変更は不要です。

エンドポイントが提供するものは?

エンドポイントは**/openai/v1パスでChat Completionsストリーミング**をサポートします。URL形式は以下のとおりです:

https://runtime.sagemaker.REGION.amazonaws.com/endpoints/ENDPOINT_NAME/openai/v1

すべての標準的なOpenAI SDK機能(client.chat.completions.createstream=Trueによるストリーミング)はOpenAIのパブリックAPIと同じように動作します。つまりLangChain ChatOpenAIクラスAWS Strands AgentsLlamaIndex OpenAIモジュール、OpenAIクライアントを通じて動作するその他のライブラリはすべて、自社インフラへのドロップイン置き換えを手に入れることになります。

認証はどのように機能するのか?

認証はSageMaker Python SDKを通じてAWS認証情報から生成された時間制限付きBearerトークンを使用します。トークンは最大12時間有効で、クライアントサイドのSigV4事前署名URLとして生成され、認証時の追加ネットワーク呼び出しは不要です——OpenAI APIキーを直接使用する場合と比べてオーバーヘッドは実質ゼロです。

戦略的な意味合いは何か?

この動きはOpenAI APIスタンダードをLLMツールチェーンの事実上のポータブルインターフェースとして確立するものです。AWSはこれにより、開発者エコシステムが1つのAPIに対してコードを書いて異なる基盤で動かせる方が、自社SDKを強制するよりも簡単であることを認めたことになります。これは10年以上前のS3 APIに対するAWSのアプローチと同様で、後にMinIO、Cloudflare R2、Wasabiなどが採用する標準となりました。

エンタープライズユーザーにとって、重要な道筋が開かれます:概念実証フェーズでOpenAIで開発したアプリケーションを、追加のリファクタリングなしにDeepSeek V3、Llama 4、Mistral Largeなど自社SageMakerインフラ上のオープンソースモデルに移行できます。推論コストは予測可能(トークン課金ではなく時間ベースのGPU予約)になり、データは自社のAWS組織内に留まります。

次のステップは?

OpenAI EmbeddingsOpenAI Vision APIのサポートはこの発表では明示されていませんが、AWSのドキュメントではロードマップに含まれていることが示唆されています。マルチモデルの推論コンポーネントはすでに動作しているため、チームは同じOpenAI互換ロジックを同一エンドポイントで複数のモデルにスケールさせることができます。

よくある質問

OpenAIからSageMakerへの具体的な移行方法は?
開発者はbase_urlとAPIキーを変更するだけです——OpenAI SDK(Python、Node.js、JavaScriptクライアント)を使用するコードはそのままです。URL形式はhttps://runtime.sagemaker.REGION.amazonaws.com/endpoints/NAME/openai/v1で、APIキーにはAWS認証情報から生成されたBearerトークンを使用します。
認証はどう変わりますか?
Bearerトークンは最大12時間有効で、SageMaker Python SDKを通じてクライアントサイドのSigV4事前署名URLとして生成されます。認証時の追加ネットワーク呼び出しは不要です。これはOpenAI APIキーを直接使用する場合と比べてオーバーヘッドがほぼゼロであることを意味します。
どのモデルとデプロイオプションがサポートされていますか?
APIはすべての既存SageMakerリアルタイム推論エンドポイントをサポートします——推論コンポーネントを通じたシングルモデルおよびマルチモデルデプロイメント。SageMakerにデプロイされた任意のオープンソースモデル(Llama、Mistral、Qwen、DeepSeek)は自動的にOpenAI互換レイヤーを取得します。