🟢 🏥 实践应用 2026年4月25日星期六 · 2 分钟阅读

Anthropic推出Rate Limits API:管理员现可通过编程方式获取组织和工作区的速率限制配置

Editorial illustration: Anthropic Rate Limits API — 组织速率限制的编程访问

为什么重要

Anthropic于2026年4月24日发布了Rate Limits API,这是Admin API的组成部分,允许管理员通过编程方式读取为组织和各工作区配置的速率限制。端点按模型组、批处理、文件、技能和网页搜索工具返回限制信息,需使用专用的Admin API密钥。

Anthropic于2026年4月24日在其发布说明中宣布了新的Rate Limits API,这是更广泛Admin API的组成部分,允许管理员通过编程方式获取为其组织和各工作区设置的速率限制配置。这是对此前仅在Claude Console图形界面中存在的功能的自然延伸。

新API暴露哪些端点,返回什么内容?

该API暴露两个主要端点,均可通过https://api.anthropic.com访问。**GET /v1/organizations/rate_limits返回应用于组织级别的所有速率限制,涵盖Messages API及相关资源(Claude Managed Agents的限制不包含在内)。GET /v1/organizations/workspaces/{workspace_id}/rate_limits**仅返回为特定工作区设置的覆盖值——响应中未出现的内容意味着该工作区继承组织级别的值。

两个端点均支持可选的group_type查询参数以按类别筛选。有效值包括model_groupbatchtoken_countfilesskillsweb_search。组织端点额外接受model参数,返回指定模型所属的组。

每条记录代表一个速率限制组。对于model_group类型的组,models字段列出共享同一配额的所有模型ID和别名(例如Opus 4.5、4.6和4.7共享同一RPM配额)。limits字段包含{type, value}键值对,其中type可为requests_per_minuteinput_tokens_per_minuteoutput_tokens_per_minute。工作区端点还为每个限制附加org_limit字段,便于审计和比对覆盖值。

三个实际应用场景

端点需要以sk-ant-admin为前缀的专用Admin API密钥,与标准API密钥有所区别。只有具备管理员角色的组织成员才能通过Claude Console生成该密钥,这意味着访问限制数据无需内置于运行时,可独立保存在CI/CD或监控流程中。

Anthropic在文档中明确列举了三种场景。第一是网关和代理的同步——自定义API网关在启动时及按计划读取当前限制,无需硬编码在Anthropic调整时会「漂移」的数值。第二是内部告警——将Usage and Cost API的数据与配置的限制进行比对,在开始返回429错误之前发出预警。第三是配置审计——验证工作区覆盖值是否仍与配置自动化工具的预期保持一致。

对于通过同一工作区为多个客户进行Claude集成的团队而言,第三点尤为实用——现在可以通过Terraform或Ansible定期检查是否有人在约定配置之外手动修改了限制。该API不支持写入操作;工作区限制仍需通过Console进行修改。

🤖

本文由人工智能基于一手来源生成。