🤖 24 AI
🟡 🤝 Agenti subota, 11. travnja 2026. · 2 min čitanja

Anthropic objavio policy framework 'Trustworthy agents in practice'

Zašto je bitno

Anthropic je objavio sveobuhvatan policy framework 'Trustworthy agents in practice' koji definira što znači razviti, deployati i koristiti AI agente na pouzdan način. Dokument služi kao smjernica za kompanije koje grade ili koriste agente.

Policy framework za eru agenata

Anthropic je u svojoj research/policy sekciji objavio “Trustworthy agents in practice” — sveobuhvatan dokument koji definira što čini AI agenta pouzdanim i kako kompanije mogu graditi i koristiti agente na način koji minimizira rizike.

Objava dolazi u trenutku kada se AI agenti naglo komercijaliziraju — Claude Cowork, OpenAI Codex, Microsoft Agent-Framework, AWS AgentCore, Anthropic Managed Agents — svi nude moćne agentske mogućnosti, ali pitanja pouzdanosti ostaju otvorena.

Što je u dokumentu?

Anthropic strukturira “trustworthy” agente kroz nekoliko dimenzija:

  • Predvidljivost — agent se ponaša konzistentno, ne improvizira u rubnim situacijama
  • Auditabilnost — sve odluke i akcije se mogu pregledati nakon činjenice
  • Granice — jasno definirano što agent smije i ne smije
  • Eskalacija — pravila kada agent mora pitati čovjeka za odobrenje
  • Reverzibilnost — agent radi reverzibilne akcije gdje god je moguće

Zašto baš sad?

Anthropic ima izravan komercijalni interes — Claude Mythos demonstrira AI sposoban autonomno pronaći i iskoristiti ranjivosti u OS-ima. Project Glasswing distribuira tu sposobnost samo 40 odabranih organizacija.

Trustworthy agents framework je pratitelj te strategije: ako Anthropic gradi najmoćnije agente na svijetu, mora i postaviti standarde kako se oni sigurno koriste. Inače će regulatori (EU AI Act, NIST) postaviti standarde umjesto njih — i to možda strože nego što industrija želi.

Praktične preporuke

Dokument završava s nizom konkretnih preporuka za:

  • Developere agenata — kako dizajnirati permission sustave i guardrails
  • Enterprise korisnike — kako vrednovati agente prije deploya
  • Regulatore — što tražiti u standardima za enterprise AI

Anthropic je do sada bio konzistentan glas za “AI safety as a feature” — Trustworthy agents in practice je nastavak te strategije i potencijalno utjecajan dokument za buduću regulaciju.

🤖 Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.