Anthropic uveo Rate Limits API: administratori sada mogu programatski dohvaćati rate-limit konfiguraciju za organizaciju i workspaceove
Zašto je bitno
Anthropic je 24. travnja 2026. objavio Rate Limits API, dio Admin API-ja koji omogućuje programatsko čitanje konfiguriranih rate limita za organizaciju i pojedine workspaceove. Endpoint vraća limite po grupama modela, batchu, fileovima, skillsovima i web search alatu, a zahtijeva poseban Admin API ključ.
Anthropic je 24. travnja 2026. u svojim release notesima najavio novi Rate Limits API, dio šireg Admin API-ja, koji administratorima omogućuje da programatski dohvate konfiguraciju rate limita postavljenu za njihovu organizaciju i pojedine workspaceove. Riječ je o prirodnom proširenju funkcionalnosti koja je dosad postojala samo u Claude Console grafičkom sučelju.
Koje endpointe novi API izlaže i što vraćaju?
API izlaže dva primarna endpointa, oba pristupna kroz https://api.anthropic.com. GET /v1/organizations/rate_limits vraća sve rate limite primijenjene na razini organizacije za Messages API i prateće resurse (limiti za Claude Managed Agents nisu uključeni). GET /v1/organizations/workspaces/{workspace_id}/rate_limits vraća samo overrideove postavljene za pojedini workspace — sve što ne postoji u odgovoru znači da workspace nasljeđuje organizacijsku vrijednost.
Oba endpointa podržavaju opcionalni group_type query parametar za filtriranje po kategoriji. Validne vrijednosti su model_group, batch, token_count, files, skills i web_search. Organizacijski endpoint dodatno prima model parametar koji vraća grupu kojoj zadani model pripada.
Svaki zapis predstavlja jednu rate limit grupu. Za grupe tipa model_group polje models lista sve ID-eve i aliasove modela koji dijele istu kvotu (npr. Opus 4.5, 4.6 i 4.7 dijele istu RPM kvotu). Polje limits sadrži parove {type, value} gdje type može biti requests_per_minute, input_tokens_per_minute ili output_tokens_per_minute. Workspace endpoint svakom limitu dodatno pridružuje org_limit polje koje olakšava usporedbu i auditiranje overrideova.
Tri praktična slučaja korištenja
Endpointi traže poseban Admin API ključ s prefiksom sk-ant-admin, različit od standardnog API ključa. Samo članovi organizacije s admin ulogom mogu ga generirati preko Claude Console sučelja, što znači da pristup limitima ne mora biti ugrađen u runtime — može se držati izoliran u CI/CD ili monitoring procesu.
Anthropic u dokumentaciji eksplicitno ističe tri scenarija. Prvi je sinkronizacija gatewayja i proxyja — vlastiti API gateway čita aktualne limite na startupu i po rasporedu, umjesto da hardkodira vrijednosti koje “drift-aju” kad ih Anthropic prepravi. Drugi je interno alertiranje — usporedba podataka iz Usage and Cost API-ja s konfiguriranim limitima za rana upozorenja prije nego što se počnu vraćati 429 greške. Treći je auditiranje konfiguracije — provjera da workspace overrideovi i dalje odgovaraju onome što provisioning automatizacija očekuje.
Za hrvatske teamove koji rade Claude integracije za više klijenata kroz iste workspaceove, treća točka je posebno relevantna — moguće je sad imati Terraform ili Ansible job koji periodički provjerava da nitko ručno nije promijenio limit izvan dogovorene konfiguracije. API ne podržava write operacije; workspace limite i dalje treba mijenjati kroz Console.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
Povezane vijesti
arXiv:2604.21361: Open Compute Project mapira time/causality kvarove u distribuiranim AI inference sustavima — 5 ms clock skew lomi observability
GitHub mijenja format App installation tokena: s 40 na ~520 znakova, breakage rizik za CI/CD pipelineove
GitHub Copilot dobio GPT-5.5 GA: dostupan na svim glavnim IDE-ovima uz 7,5× premium multiplier