GitHub: エージェントワークフローの最適化で19%〜62%のトークン削減を達成
GitHubは本番エージェントワークフローを計測し、トークン浪費の3大原因を特定した。不要なMCPツール、決定論的データフェッチ、誤設定のBashルールだ。最適化により各ワークフローで19%〜62%のトークン削減を達成した。
この記事はAIにより一次情報源から生成されました。
GitHubエンジニアリングチームは2026年5月7日、自社の本番エージェントワークフローの分析を公開した。トークン損失の具体的な数値と最適化策が示されており、同様のシステムを構築するチームにとって貴重な透明性のある事例となっている。
トークン浪費の3大原因
第1に、不要なMCPツールスキーマ。40ツールを含む完全なGitHub MCPサーバーは1ターンあたり10〜15KBのコンテキストを追加するが、ほとんどのワークフローは数個のツールしか使わない。MCP設定から未使用ツールを削除することで、1回の呼び出しのコンテキストサイズが8〜12KB削減され、1回の実行あたり数千トークンを節約できた。MCP(モデルコンテキストプロトコル)は、ツールがその言語モデルにスキーマを公開するための標準だ。
第2に、決定論的データフェッチ。エージェントの多くのステップは推論を必要としない読み取り操作だ。例えばIssueのメタデータ取得がそれに当たる。そのようなフェッチをエージェント前のCLIステップに移動し、モデル起動前に実行することで、それらの呼び出しはLLM推論ループから完全に除外できる。
第3に、誤設定のルール。Bash許可リストの1行の設定ミスが、適切なツールを呼び出す代わりにコンパイラ出力を手動で再構築する64ステップのフォールバックループを引き起こした。
ワークフローごとの具体的な節約
最適化された5つのワークフローは次の結果を達成した。Auto-Triage Issuesが62%削減(109回以上の実行)、Security Guardが43%、Smoke Claudeが59%、Daily Compiler Qualityが19%、Community Attributionが37%。Auto-Triageだけの最適化で、観測期間中に約780万の有効トークンを節約した。
Effective Tokensとはどんな指標か
GitHubはさまざまなモデル層にわたるコストを正規化するために**ET = m × (1.0 × I + 0.1 × C + 4.0 × O)**という式を開発した。Iは入力トークン、Cはキャッシュ読取トークン、Oは出力トークン、mはモデル乗数だ。出力トークンは最も高価なタイプとして4×の重みを持ち、キャッシュ読取トークンは0.1×のみとなる。この指標により、異なるモデルと異なるキャッシュパターンを使用するワークフローを直接比較できる。チームはモデルごとにドルコストを別々に追跡する必要がなくなる。
よくある質問
- Effective Tokensとはどんな指標ですか?
- ET = m × (1.0 × I + 0.1 × C + 4.0 × O)という式でコストに応じてトークンタイプを重み付けする。入力1×、キャッシュ読取0.1×、出力4×;mはモデル乗数。
- MCPツールスキーマの実際の重みは?
- 40ツールのGitHub MCPサーバーは1ターンあたり10〜15KBのコンテキストを追加する。使用するツールに絞ると8〜12KB削減でき、1回の実行あたり数千トークンを節約できる。
- 64ステップループの例とは?
- Bash許可リストの1行の設定ミスにより、ワークフローが適切なツールを呼び出す代わりにコンパイラ出力を手動で再構築し、64ステップのフォールバックループが発生した。