AWS Nova Sonic：スケーラブルな音声エージェントの3つのパターン

AWSはAmazon Nova SonicとAgentCore Gatewayを使用したスケーラブルな音声エージェントの詳細ガイドを発表しました。直接ツール、サブエージェント、セッション分割という3つのアーキテクチャパターンは、レイテンシと操作の複雑さの間の異なるトレードオフを提供します。

Amazon Nova SonicはAWSの基盤音声AIモデルです——リアルタイムで会話を行い、トーンとコンテキストを理解し、音声セッション中に外部ツールを直接呼び出すことができます。従来のパイプラインソリューションとは異なり、Nova Sonicは入力から出力まで音声処理を行い、中間の文字起こしステップを必要としません。

AgentCore Gatewayとは何か、なぜ重要なのか？

AgentCore GatewayはビジネスロジックをMCP（Model Context Protocol）ツール——Nova Sonicが中間推論層なしに呼び出せる管理されたエンドポイント——として公開するサーバーレスインフラです。このコンテキストで音声エージェントは、音声入力を受け取り、意図を理解し、音声応答を通じてリアルタイムでアクションを実行するAIシステムを指します。

Gatewayの主な利点は中間層のレイテンシを排除することです。ユーザーが質問すると、モデルは同じセッション内で直接ツールを呼び出して応答を返します。別のエージェントオーケストレーターに制御を渡す必要はありません。

3つのパターンのうち最もレイテンシが低いのはどれか？

AWSは3つのアーキテクチャパターンを説明しており、それぞれに明確なトレードオフがあります。

直接ツール — Nova SonicはAgentCore Gateway経由でMCPツールを直接呼び出します。最もシンプルなアーキテクチャで低レイテンシですが、多段階ワークフローへのスケーラビリティは低いです。
サブエージェント — 複雑なタスクは独自のモデルとツールを持つ専門エージェントに委譲されます。サブエージェントの推論による追加レイテンシを削減するため、小さいモデル（Nova LiteまたはMicro）の使用が推奨されます。
セッション分割 — 会話をフェーズ（例：認証→アカウント管理→クレジット照会）に分割し、それぞれを専用プロンプトと最小限のツールセットを持つ独立したNova Sonicセッションとして処理します。前のフェーズのコンテキストは会話履歴として引き渡されます。

セッション分割は最も低い運用レイテンシを達成します。各セッションはそのフェーズに関連するツールのみを持つためです——小さいツールセットは選択が速く、システムプロンプトのオーバーヘッドも少なくなります。唯一のコストはフェーズ間の切り替え時の短い一時停止です。

実用的なレイテンシ最適化

AWSはいくつかの具体的な技術を挙げています。独立したツールの並列呼び出し（Strandsフレームワークでネイティブサポート）、認証直後のユーザーデータのプリフェッチ、「少々お待ちください…」などのフィラーフレーズを使用したツール呼び出しの時間コストのマスキングです。これら3つの技術は選択したアーキテクチャパターンに関係なく適用できます。

出典：AWS Machine Learning Blog

よくある質問

Amazon Nova Sonicとは何ですか、従来の音声パイプラインソリューションとどう違いますか？

Amazon Nova SonicはAWSの基盤音声AIモデルで、中間の文字起こしステップなしに会話を処理します——トーンとコンテキストを理解し、リアルタイムの音声セッション中に外部ツールを直接呼び出すことができます。

3つのアーキテクチャパターンのうち最もレイテンシが低いのはどれですか？

セッション分割（セッションセグメンテーション）が最も低い運用レイテンシを達成します。各会話フェーズはそのフェーズに関連するツールのみを持つためです——小さいツールセットは選択が速く、システムプロンプトのオーバーヘッドも少なくなります。

AgentCore Gatewayは音声エージェントのツール呼び出しをどのように高速化しますか？

AgentCore GatewayはビジネスロジックをMCPツールとして公開し、Nova Sonicは中間推論層なしに直接呼び出せます——中間層のレイテンシを排除し、モデルは同じ音声セッション内で直接ツールを呼び出して応答を返します。

AWS：Amazon Nova Sonicによるスケーラブルな音声エージェントの3つのアーキテクチャパターン

AgentCore Gatewayとは何か、なぜ重要なのか？

3つのパターンのうち最もレイテンシが低いのはどれか？

実用的なレイテンシ最適化

よくある質問

出典

関連ニュース