Claude Sonnet 5:Anthropic 最具智能体能力的模型成为新标准
Anthropic 今日发布 Claude Sonnet 5——该模型能够规划多步骤任务、操控浏览器与终端,在核心任务上的表现接近 Opus 4.8,同时提供 2026 年 8 月 31 日前每百万 token 输入 $2、输出 $10 的入门价格,以及 100 万 token 上下文窗口。
本文由人工智能基于一手来源生成。
2026 年 6 月 30 日,Anthropic 正式发布 Claude Sonnet 5,可通过 API 标识符 claude-sonnet-5 访问。公司将其描述为「迄今最具智能体能力的 Sonnet」——该模型不仅能回答问题,还能利用网页浏览器、终端等工具规划、执行并自我评估多步骤任务。在特定任务集上,Anthropic 表示 Sonnet 5 的性能接近 Opus 4.8,但价格显著更低。
Claude Sonnet 5 即日起成为所有计划的默认模型
即日起,Sonnet 5 将取代前代模型,成为 Free 和 Pro 计划的默认模型,同时也可在 Max、Team、Enterprise 和 Claude Code 订阅中使用。同日,Claude Code v2.1.197 将 Sonnet 5 设为开发环境中的新默认模型,为开发团队提供 100 万 token 上下文窗口(相当于约 75 万词文本或一个完整的大型代码库),每次调用最大输出 128,000 token。
这种大上下文窗口与智能体能力的结合,对需要分析长代码库、处理复杂文档或执行长期自主任务(上下文连续性至关重要)的团队尤为重要。
入门价格与新版 Tokenizer
Anthropic 推出极具竞争力的入门价格,有效期至 2026 年 8 月 31 日:每百万输入 token $2,每百万输出 token $10,比 9 月起生效的标准定价(输入 $3、输出 $15)低约 33%。
从 Sonnet 4.6 迁移的开发者需注意一项重要技术变更:Sonnet 5 使用与 Opus 4.7 和 Fable 5 共享的新版 tokenizer。根据内容类型,相同文本的 token 数量可能比 Sonnet 4.6 多出最多 35%。对于高调用量的应用,这一 tokenizer 差异可能部分抵消较低入门价格带来的节省——建议在最终评估成本之前,先用实际流量进行测试。
API 有哪些变化?
迁移至 Sonnet 5 将带来相较于 Sonnet 4.6 的三项重大(breaking)变更,可能导致现有集成在无预警情况下中断:
1. 自适应思考默认开启。 与 Sonnet 4.6 需要显式激活不同,Sonnet 5 在判断有益于任务时会自动使用扩展思考模式。假设输出中不含思考块(thinking block)的应用需要调整响应解析逻辑。
2. 手动 budget_tokens 参数已移除。 Sonnet 4.6 的 API 接受 budget_tokens 用于显式限制思考量。在 Sonnet 5 中,传入该参数将返回 HTTP 400 错误。所有显式传入该参数的 API 调用必须在迁移前更新。
3. 非标准采样参数值返回 400 错误。 超出推荐范围的 temperature、top_p 和 top_k 值现在会立即返回 HTTP 400。使用极端参数值的实验性实现需要进行调整。
建议团队的做法:在并行 staging 环境中运行新模型,记录所有 API 调用的状态码进行验证,再迁移生产环境。
智能体能力与性能
Sonnet 5 的核心差异化能力在于规划和执行多步骤任务。模型可为复杂目标制定计划,使用浏览器、终端、文件系统等工具执行计划,然后评估目标是否达成,并在必要时调整方案。这使其适用于自动化开发任务、研究、报告生成,以及以往模型无法自主完成的工作流程。
Anthropic 报告称,Sonnet 5 在推理、工具使用、编程及复杂问题集求解等任务上较 Sonnet 4.6 有实质性提升。在某些评测中,其性能与 Opus 4.8 在统计上无显著差异——考虑到两者之间的价格差距,这一点尤为重要。
安全改进与网络安全特性
Sonnet 5 在模型可靠性和安全性方面带来可量化的改进。与 Sonnet 4.6 相比,它表现出更少的幻觉和顺从性,对提示注入(prompt injection)攻击的抵抗力更强,并能更好地拒绝恶意请求。网络安全防护措施默认启用,Anthropic 强调该模型的网络安全能力实质上低于 Opus 系列模型——这是对不同级别和用途模型进行安全配置差异化的有意决策。
Amazon Bedrock 与更广泛的生态系统可用性
Claude Sonnet 5 同时在多个平台上发布。在 Amazon Bedrock 上,标识符为 us.anthropic.claude-sonnet-5,Anthropic 将其定位为面向 AWS 基础设施用户的「Sonnet 价格的顶级智能」。它同样在 AWS 上的 Claude 平台提供,入门价格完全相同。
跨平台同步推出——Anthropic 直接渠道、Amazon Bedrock 和 GitHub Copilot(同日达到 GA 状态)——标志着一种协调一致的发布策略,无论使用哪个基础设施平台,都能提供一致的体验。对于考虑迁移的团队:API 兼容性测试,尤其是上述三项重大变更,应作为第一天的优先事项。
常见问题
- Claude Sonnet 5 的入门价格是多少?有效期到何时?
- 2026 年 8 月 31 日前,价格为每百万 token 输入 $2、输出 $10。此后标准定价将上调至每百万 token $3/$15。
- 相较于 Sonnet 4.6,有哪三项重大 API 变更?
- 自适应思考默认开启;手动参数 budget_tokens 已移除,传入该参数将返回 HTTP 400;temperature、top_p 和 top_k 的非标准值同样返回 HTTP 400 错误。
- Claude Sonnet 5 是否可在 Amazon Bedrock 上使用?
- 可以,在 Amazon Bedrock 和 AWS 上的 Claude 平台中标识符为 us.anthropic.claude-sonnet-5,入门价格相同。