🟢 🏥 U praksi subota, 25. travnja 2026. · 2 min čitanja

Anthropic uveo Rate Limits API: administratori sada mogu programatski dohvaćati rate-limit konfiguraciju za organizaciju i workspaceove

Editorial illustration: Anthropic Rate Limits API — programatski dohvat limita organizacije

Zašto je bitno

Anthropic je 24. travnja 2026. objavio Rate Limits API, dio Admin API-ja koji omogućuje programatsko čitanje konfiguriranih rate limita za organizaciju i pojedine workspaceove. Endpoint vraća limite po grupama modela, batchu, fileovima, skillsovima i web search alatu, a zahtijeva poseban Admin API ključ.

Anthropic je 24. travnja 2026. u svojim release notesima najavio novi Rate Limits API, dio šireg Admin API-ja, koji administratorima omogućuje da programatski dohvate konfiguraciju rate limita postavljenu za njihovu organizaciju i pojedine workspaceove. Riječ je o prirodnom proširenju funkcionalnosti koja je dosad postojala samo u Claude Console grafičkom sučelju.

Koje endpointe novi API izlaže i što vraćaju?

API izlaže dva primarna endpointa, oba pristupna kroz https://api.anthropic.com. GET /v1/organizations/rate_limits vraća sve rate limite primijenjene na razini organizacije za Messages API i prateće resurse (limiti za Claude Managed Agents nisu uključeni). GET /v1/organizations/workspaces/{workspace_id}/rate_limits vraća samo overrideove postavljene za pojedini workspace — sve što ne postoji u odgovoru znači da workspace nasljeđuje organizacijsku vrijednost.

Oba endpointa podržavaju opcionalni group_type query parametar za filtriranje po kategoriji. Validne vrijednosti su model_group, batch, token_count, files, skills i web_search. Organizacijski endpoint dodatno prima model parametar koji vraća grupu kojoj zadani model pripada.

Svaki zapis predstavlja jednu rate limit grupu. Za grupe tipa model_group polje models lista sve ID-eve i aliasove modela koji dijele istu kvotu (npr. Opus 4.5, 4.6 i 4.7 dijele istu RPM kvotu). Polje limits sadrži parove {type, value} gdje type može biti requests_per_minute, input_tokens_per_minute ili output_tokens_per_minute. Workspace endpoint svakom limitu dodatno pridružuje org_limit polje koje olakšava usporedbu i auditiranje overrideova.

Tri praktična slučaja korištenja

Endpointi traže poseban Admin API ključ s prefiksom sk-ant-admin, različit od standardnog API ključa. Samo članovi organizacije s admin ulogom mogu ga generirati preko Claude Console sučelja, što znači da pristup limitima ne mora biti ugrađen u runtime — može se držati izoliran u CI/CD ili monitoring procesu.

Anthropic u dokumentaciji eksplicitno ističe tri scenarija. Prvi je sinkronizacija gatewayja i proxyja — vlastiti API gateway čita aktualne limite na startupu i po rasporedu, umjesto da hardkodira vrijednosti koje “drift-aju” kad ih Anthropic prepravi. Drugi je interno alertiranje — usporedba podataka iz Usage and Cost API-ja s konfiguriranim limitima za rana upozorenja prije nego što se počnu vraćati 429 greške. Treći je auditiranje konfiguracije — provjera da workspace overrideovi i dalje odgovaraju onome što provisioning automatizacija očekuje.

Za hrvatske teamove koji rade Claude integracije za više klijenata kroz iste workspaceove, treća točka je posebno relevantna — moguće je sad imati Terraform ili Ansible job koji periodički provjerava da nitko ručno nije promijenio limit izvan dogovorene konfiguracije. API ne podržava write operacije; workspace limite i dalje treba mijenjati kroz Console.

🤖

Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.