Anthropic:Claude Opus 4.8 が 1M トークンの文脈と適応的思考を携えて登場
Claude Opus 4.8 は Anthropic が 2026 年 5 月 28 日に公開した最も高性能な一般提供モデルです。Claude API、Amazon Bedrock、Vertex AI でデフォルト 100 万(1M)トークンの文脈ウィンドウ、最大 128k 出力トークン、そして必要なときだけ推論を起動する適応的思考を提供します。
この記事はAIにより一次情報源から生成されました。
Anthropic は 2026 年 5 月 28 日に Claude Opus 4.8(モデル ID claude-opus-4-8)を公開しました。これは同社の最も高性能な一般提供(GA — General Availability)モデルです。モデル本体に加え、本番アプリケーションでのモデル挙動の制御を広げる一連の付随 API 機能も発表されました。
Claude Opus 4.8 はどれほどの文脈と出力を提供しますか?
Claude Opus 4.8 は Claude API、Amazon Bedrock、Google Vertex AI でデフォルト 100 万(1M)トークンの文脈ウィンドウに対応します。Microsoft Foundry では上限が 200k トークンです。最大出力トークン数は 128k です。本モデルは前世代の Claude Opus 4.7 と同じツールおよびプラットフォーム機能群を維持しています。
文脈ウィンドウ(context window)とは、1 回の会話の間にモデルが「ワーキングメモリ」に同時に保持できるテキストの総量——プロンプトと応答の両方——を指します。
Claude Opus 4.8 はどのように適応的思考を使いますか?
**適応的思考(adaptive thinking)**を有効にすると、Claude Opus 4.8 は具体的なターンが必要とするときだけ推論プロセスを起動し、同じ努力水準で Claude Opus 4.7 と比べて無駄に消費される思考トークンを削減します。Claude Opus 4.8 の effort パラメータは現在、Claude Code や Messages API を含むすべての面でデフォルトが high に設定されています。
これにより、より高い応答品質(高 effort)と少ないトークン消費が組み合わされます。モデルは単純なタスクに推論能力を費やさないからです。
公開に伴いどのような新しい API 機能が登場しますか?
Anthropic は同時に**会話途中システムメッセージ(mid-conversation system messages)**を導入しました——role: "system" ロールを持つメッセージで、ユーザーのターンの後に messages 列内へ送信できます(配置に関するルールあり)。長いセッション中に prompt cache のヒットを失わずに指示を変更でき、beta ヘッダーも要求しません。
拒否(refusals)された応答上の stop_details フィールドが公式に文書化されました。category(cyber、bio、または null)と読みやすい説明を返すため、アプリは拒否の各クラスを適切な次のステップへ振り分けられます。
prompt caching にキャッシュ可能なプロンプトの最小長は 1,024 トークンに引き下げられ、Claude Opus 4.7 より低くなったことで、キャッシュの採算性がより短いクエリにも広がります。Prompt caching は処理済みのプロンプト部分を保存し、各呼び出しで再計算しないようにするため、時間とコストの両方を節約します。
サンプリングと制限に関してどう振る舞いますか?
サンプリングパラメータ temperature、top_p、top_k をデフォルトと異なる値に設定すると、Claude Opus 4.8 では Claude Opus 4.7 と同様に 400 エラーを返します。Anthropic は旧バージョンからの移行時の詳細についてマイグレーションガイドを参照するよう案内しています。
Claude Code では、Max プランのユーザーは現在 Claude Opus 4.8 でデフォルトで fast mode を使用し、長時間タスク向けの Auto mode もより多くのユーザーに拡張されました。Workflows は Claude Code で research preview として提供され、多段階のエージェント計画を定義・実行できます。
これは開発チームにとって何を意味しますか?
百万級の文脈、適応的思考、そして拒否に対するより細かな制御の組み合わせにより、Claude Opus 4.8 は大規模文書を扱う要求の高いエージェント・分析ワークフロー向けのモデルとして位置づけられます。本モデルは high-resolution image input(長辺最大 2576 ピクセル)、Task budgets、computer use、advisor tool にも対応しており、Claude Opus 4.7 と同様です。
よくある質問
- Claude Opus 4.8 モデルの文脈ウィンドウはどのくらいですか?
- Claude Opus 4.8 は Claude API、Amazon Bedrock、Google Vertex AI でデフォルト 100 万トークンの文脈ウィンドウに対応し、Microsoft Foundry では 200k トークンが上限です。最大出力トークン数は 128k です。
- Claude Opus 4.8 の適応的思考(adaptive thinking)とは何ですか?
- 適応的思考は具体的なリクエストが必要とするときだけ推論プロセスを起動し、同じ努力(effort)水準で Claude Opus 4.7 と比べて無駄に消費される思考トークン数を削減します。
- 会話途中のシステムメッセージ(mid-conversation system messages)とは何ですか?
- これは role: 「system」ロールを持つメッセージで、ユーザーのターンの後に messages 列内へ送信できます。長いセッション中に指示を変更しつつ prompt cache のヒットを維持でき、beta ヘッダーも不要です。