Wie viele Punkt-zu-Punkt-Verbindungen entstehen ohne A2A-Gateway in einem System mit 20 Agenten?

Ohne zentrale Koordination können 20 Agenten bis zu 190 direkte Verbindungen erfordern (Formel N×(N−1)/2), was operativ durch verteilte Credentials und Custom-Routing untragbar wird.

Wie findet der Gateway den richtigen Agenten, ohne den genauen Namen zu kennen?

Agentenbeschreibungen sind mit Bedrock Titan Text Embeddings als Vektoren in Amazon S3 Vectors indiziert, sodass Clients eine Anfrage in natürlicher Sprache senden und den passenden Agenten per semantischer Suche finden können.

Was bedeutet das Zero-Secret-Modell für Clients, die den Gateway verwenden?

Clients erhalten nur bereichsbeschränkte JWT-Tokens; alle Backend-OAuth-Credentials verwahrt AWS Secrets Manager, und Clients sehen oder verwalten niemals Passwörter zu einzelnen Agenten.

AWS serverloser A2A-Gateway: KI-Agenten-Erkennung und -Kontrolle

Amazon Web Services hat eine serverlose Referenzarchitektur für einen A2A-Gateway veröffentlicht, der Erkennung, Routing und Zugriffskontrolle zwischen KI-Agenten zentralisiert. Zwanzig Agenten ohne Koordination erzeugen bis zu 190 gegenseitige Verbindungen — der Gateway reduziert das auf einen einzigen Einstiegspunkt.

Mit wachsender Anzahl von KI-Agenten im Unternehmen steigt auch das operative Chaos ohne zentrale Koordination. Amazon Web Services hat eine offene serverlose A2A-Gateway-Referenzarchitektur veröffentlicht, die dieses Problem auf Infrastrukturebene löst.

Warum verursacht eine wachsende Anzahl von Agenten ein Verbindungsproblem?

Das Problem ist einfach zu beschreiben, aber in der Praxis ernst. Jede direkte Verbindung zwischen zwei Agenten erfordert eigene Authentifizierung, eigene Routing-Logik und eigene Zugriffskontrolle. Bei N Agenten beträgt die maximale Anzahl solcher Punkt-zu-Punkt-Verbindungen N×(N−1)/2.

Bei 10 Agenten sind das 45 Verbindungen. Bei 20 Agenten — eine Situation, die in Enterprise-Deployments nicht ungewöhnlich ist — kann das System bis zu 190 direkte Verbindungen erfordern. Jede trägt eigene Credentials, die rotiert werden müssen, eigene Fehlerbehandlungslogik und eigenen Autorisierungscode. Die Fragmentierung wird so komplex, dass das Hinzufügen eines neuen Agenten ein eigenständiges Projekt wird.

Der A2A-Gateway reduziert das auf einen einzigen Einstiegspunkt.

Dreischichtige Architektur

Verwaltungsschicht

Die Management-Schicht hält eine zentrale Agenten-Registry und ermöglicht deren Erkennung. Jeder Agent registriert sich einmal, und der Gateway generiert und cached automatisch eine agent-card.json, die unter dem standardisierten Pfad GET /agents/{agentId}/.well-known/agent-card.json verfügbar ist. URLs in der Karte werden auf die Gateway-Domain umgeschrieben, sodass Clients niemals direkt mit Backends kommunizieren.

Die Agenten-Erkennung funktioniert auf zwei Wegen: durch genaue Namensübereinstimmung oder semantische Suche in natürlicher Sprache. Agentenbeschreibungen sind mit Amazon Bedrock Titan Text Embeddings indiziert und in Amazon S3 Vectors gespeichert. Ein Client kann eine Anfrage wie „Agent, der Verträge auf Deutsch analysiert” senden und eine Liste semantisch relevanter Agenten erhalten, ohne die genauen Namen zu kennen.

Kontrollschicht

Die Control-Schicht verwaltet Autorisierung und Rate-Limits. Die Authentifizierung basiert auf dem OAuth 2.0 Client-Credentials-Flow über Amazon Cognito — der Client erhält einen JWT-Token mit Scopes, die an spezifische Agenten gebunden sind, auf die zugegriffen werden darf.

Ein Lambda-Autorisierer wertet JWT-Scopes bei jeder Anfrage aus. Rate-Limiting wird pro Benutzer-Agenten-Kombination angewendet und ist mit atomaren Zählern in Amazon DynamoDB implementiert — selbst parallele Anfragen können das Limit dank DynamoDB-Atomoperationen nicht umgehen.

Ausführungsschicht

Die Execution-Schicht ist ein Proxy, der die autorisierte Anfrage empfängt, Backend-Credentials aus AWS Secrets Manager abruft, sich beim Zielagenten authentifiziert und die Antwort an den Client weiterleitet. Server-Sent Events-Streaming wird über den Lambda Web Adapter unterstützt, sodass Clients Teilantworten in Echtzeit empfangen können, ohne zu blockieren.

Zero-Secret-Modell auf der Client-Seite

Das Sicherheitsdesign geht vom Grundsatz aus, dass der Client keinen Zugriff auf irgendein Passwort oder OAuth-Geheimnis gegenüber Backends haben sollte. Alle Backend-Credentials hält ausschließlich Secrets Manager; Clients kommunizieren nur mit dem Gateway über bereichsbeschränkte JWT-Tokens, die für einen begrenzten Zeitraum gültig sind.

In Kombination mit optionalem privatem VPC-Deployment (Gateway und alle AWS-Dienste nur innerhalb des privaten Netzwerks ohne öffentliches Internet) und AWS Direct Connect-Verbindungen für On-Premises-Agenten erfüllt die Architektur die Anforderungen von Enterprise-Umgebungen mit hohen Sicherheitsanforderungen.

Implementierung unterstützt offenes A2A-Protokoll

Der Gateway implementiert explizit das A2A-Protokoll (Agent-to-Agent) — einen offenen Standard für Interoperabilität zwischen KI-Agenten verschiedener Anbieter. Unterstützt werden sowohl JSON-RPC als auch HTTP+REST-Binding, was bedeutet, dass auf verschiedenen Plattformen aufgebaute Agenten über denselben Gateway kommunizieren können, ohne Änderungen auf der Client-Seite.

Der gesamte Infrastrukturcode ist als Terraform-Konfiguration (Version 1.5.0 oder neuer) verfügbar. Terraform provisioniert automatisch DynamoDB-Tabellen für die Agenten-Registry, Berechtigungen und Rate-Limit-Zähler, den Cognito-User-Pool, Lambda-Funktionen für alle Operationen, API Gateway und IAM-Rollen. Der Docker-Build-Proxy für Lambda-Container wird automatisch als Teil des terraform apply-Prozesses ausgeführt.

Praktischer Kontext

Die Referenzarchitektur ist kein produktionsreifer Dienst, sondern ein dokumentiertes Muster, das Teams anpassen können. AWS betont, dass der Gateway als Grundlage gedacht ist, auf der Organisationen eigene Sicherheitsschichten, Monitoring und domänenspezifisches Logging hinzufügen. Backends müssen selbst Schutz vor Prompt-Injection-Angriffen implementieren — der Gateway stellt sicher, wer auf einen Agenten zugreifen darf, analysiert aber nicht den Nachrichteninhalt.

AWS veröffentlicht serverlosen A2A-Gateway, der 190 Punkt-zu-Punkt-Verbindungen durch eine zentrale Registry ersetzt