GitHub: エージェントワークフローで19〜62%のトークン削減

GitHubは本番エージェントワークフローを計測し、トークン浪費の3大原因を特定した。不要なMCPツール、決定論的データフェッチ、誤設定のBashルールだ。最適化により各ワークフローで19%〜62%のトークン削減を達成した。

GitHubエンジニアリングチームは2026年5月7日、自社の本番エージェントワークフローの分析を公開した。トークン損失の具体的な数値と最適化策が示されており、同様のシステムを構築するチームにとって貴重な透明性のある事例となっている。

トークン浪費の3大原因

第1に、不要なMCPツールスキーマ。40ツールを含む完全なGitHub MCPサーバーは1ターンあたり10〜15KBのコンテキストを追加するが、ほとんどのワークフローは数個のツールしか使わない。MCP設定から未使用ツールを削除することで、1回の呼び出しのコンテキストサイズが8〜12KB削減され、1回の実行あたり数千トークンを節約できた。MCP（モデルコンテキストプロトコル）は、ツールがその言語モデルにスキーマを公開するための標準だ。

第2に、決定論的データフェッチ。エージェントの多くのステップは推論を必要としない読み取り操作だ。例えばIssueのメタデータ取得がそれに当たる。そのようなフェッチをエージェント前のCLIステップに移動し、モデル起動前に実行することで、それらの呼び出しはLLM推論ループから完全に除外できる。

第3に、誤設定のルール。Bash許可リストの1行の設定ミスが、適切なツールを呼び出す代わりにコンパイラ出力を手動で再構築する64ステップのフォールバックループを引き起こした。

ワークフローごとの具体的な節約

最適化された5つのワークフローは次の結果を達成した。Auto-Triage Issuesが62%削減（109回以上の実行）、Security Guardが43%、Smoke Claudeが59%、Daily Compiler Qualityが19%、Community Attributionが37%。Auto-Triageだけの最適化で、観測期間中に約780万の有効トークンを節約した。

Effective Tokensとはどんな指標か

GitHubはさまざまなモデル層にわたるコストを正規化するために**ET = m × (1.0 × I + 0.1 × C + 4.0 × O)**という式を開発した。Iは入力トークン、Cはキャッシュ読取トークン、Oは出力トークン、mはモデル乗数だ。出力トークンは最も高価なタイプとして4×の重みを持ち、キャッシュ読取トークンは0.1×のみとなる。この指標により、異なるモデルと異なるキャッシュパターンを使用するワークフローを直接比較できる。チームはモデルごとにドルコストを別々に追跡する必要がなくなる。

よくある質問

Effective Tokensとはどんな指標ですか？

ET = m × (1.0 × I + 0.1 × C + 4.0 × O)という式でコストに応じてトークンタイプを重み付けする。入力1×、キャッシュ読取0.1×、出力4×；mはモデル乗数。

MCPツールスキーマの実際の重みは？

40ツールのGitHub MCPサーバーは1ターンあたり10〜15KBのコンテキストを追加する。使用するツールに絞ると8〜12KB削減でき、1回の実行あたり数千トークンを節約できる。

64ステップループの例とは？

Bash許可リストの1行の設定ミスにより、ワークフローが適切なツールを呼び出す代わりにコンパイラ出力を手動で再構築し、64ステップのフォールバックループが発生した。

GitHub: エージェントワークフローの最適化で19%〜62%のトークン削減を達成

トークン浪費の3大原因

ワークフローごとの具体的な節約

Effective Tokensとはどんな指標か

よくある質問

出典

関連ニュース