AWSがAmazon BedrockにIAMプリンシパルごとの詳細なコスト配分を導入
なぜ重要か
Amazon Bedrockがこれより推論コストをIAMプリンシパル——APIを呼び出す特定のユーザー、ロール、またはフェデレーティッドアイデンティティ——ごとに追跡できるようになりました。この機能はAWS Cost and Usage Reports(CUR 2.0)およびCost Explorerと追加費用なしで統合されます。直接IAMユーザー、アプリケーションロール、フェデレーティッド認証、LLMゲートウェイプロキシパターンの4つのシナリオをサポートします。すべての商用AWSリージョンで利用可能です。
Amazon Web Servicesは2026年4月17日に、ホスティングされたLLMサービスを使用する際の主要な企業問題の一つを解決するAmazon Bedrockの新機能を発表しました:誰がいくら消費したか。著者のBa’Carri Johnson、Ajit Mahareddy、Sofian Hamiti、Vadim Omeltchenkoは、この機能が価値をもたらす4つのアーキテクチャシナリオを詳しく説明しています。
問題:1つのAPI、多くのユーザー
典型的なエンタープライズのBedrockデプロイメントには、同じモデルを呼び出す数十のチームと数百のアプリケーションがあります。従来のAW請求書は合計コストを表示しますが、誰がそれを生み出しているかは表示しません——つまりCFOは誰が何を支払うかを決定できません。
新機能はIAMプリンシパル——各推論呼び出しを開始した特定のIAMユーザー、ロール、またはフェデレーティッドアイデンティティ——を追跡することでこれを解決します。
仕組み
CUR 2.0(コストおよび使用状況レポート)のline_item_iam_principal列がアイデンティティのARNを表示します。データはAWS Cost Explorerに直接流れ込み、フィルタリング、グループ化、可視化できます。
ソリューション全体は追加費用なしかつ追加インフラなしで動作します——既存のIAMメカニズムを使用します。
オプションのタグ付け
より高いレベルで集約するために、組織はIAMリソースにコスト配分タグを追加できます:
- プリンシパルタグ — ユーザーまたはロールに永続的に割り当て
- セッションタグ — AssumeRole中に動的に渡されるか、アイデンティティプロバイダーアサーションから取得
タグ付けされたデータはiamPrincipal/プレフィックス付きでCost Explorerに流れ込み、チーム、プロジェクト、コストセンター、またはカスタムディメンションでのグループ化が可能です。
4つのエンタープライズシナリオ
シナリオ1——直接IAMアクセス
個人の開発者がIAM認証情報またはAPIキーを使用します。帰属は直接的です。チームは部門のチャージバックのためにユーザーにメタデータ(部門、コストセンター)でタグ付けします。
シナリオ2——アプリケーションアクセス
AWSインフラ(Lambda、EC2、ECS)で実行される各サービスが独自のIAMロールを引き受けます。Assumed-role ARNがアプリケーションごとのコストを自動的に記録し、プロジェクトのロールアップのためのオプションタグを付与します。
シナリオ3——フェデレーティッド認証
ユーザーが企業のアイデンティティプロバイダー(Okta、Azure AD、Auth0)を通じて認証し、共有のIAMロールを引き受けます。ARN内のセッション名が個々のユーザーを識別します。IdPからのセッションタグがユーザーごとのIAMリソース管理なしにチーム/コストセンター情報をもたらします。
シナリオ4——LLMゲートウェイプロキシ
最も複雑です。APIゲートウェイがユーザーとBedrockの間に位置する場合、ユーザーごとの可視性にはゲートウェイが各ユーザーに対して異なるセッション名とタグでAssumeRoleを呼び出す必要があります。マルチテナントSaaSデプロイメントでのテナントレベルまたはユーザーレベルのコスト分離を可能にします。
これがSaaSが実際に必要としているパターンです——これまではカスタムソリューションで対応する必要がありました。
実装手順
AWSは明確な5ステップのフローを文書化しています:
- アーキテクチャパターンを特定する(シナリオ1-4)
- CUR 2.0設定でIAMプリンシパルデータを有効化する
- IAMリソースにタグを適用するか、IdPセッションタグパッシングを設定する
- AWS Billingコンソールでコスト配分タグを有効化する
- 24〜48時間後にCost Explorerでコストを確認する
機能特性
- 追加インフラなし — 既存のIAMメカニズムを使用
- マルチモデルサポート — Claude、Nova、その他のBedrockモデル
- トークンレベルの粒度 — 呼び出し元ごとの入力・出力トークンコストを別々に記録
- SaaS対応 — セッションベースのアイデンティティによるマルチテナント
すべての商用AWSリージョンで追加料金なしで利用可能です。
背景
エンタープライズのLLM採用は根本的に「誰がどの呼び出しを支払うか」という問題で停滞していました。財務フロー全体が測定できない場合、財務部門にAIプロジェクトを正当化するのは困難です。AWSはこれで主要な非技術的ブロッカーの一つを解消しました——これはほとんどの新しいモデルよりも有用な動きです。
この記事はAIにより一次情報源から生成されました。