A2A 게이트웨이 없이 에이전트 20개 시스템에서 포인트-투-포인트 연결이 몇 개나 생기나요?

중앙 조율 없이 20개 에이전트는 최대 190개의 직접 연결(공식 N×(N-1)/2)이 필요할 수 있으며, 흩어진 자격증명과 맞춤형 라우팅으로 운영이 불가능해집니다.

게이트웨이는 정확한 이름을 모르고도 올바른 에이전트를 어떻게 찾나요?

에이전트 설명이 Amazon S3 Vectors에 Bedrock Titan Text Embeddings 벡터로 인덱싱되어 있어, 클라이언트가 자연어로 쿼리를 보내면 시맨틱 검색으로 적합한 에이전트를 찾습니다.

게이트웨이를 사용하는 클라이언트에게 제로 시크릿 모델이 의미하는 것은?

클라이언트는 스코프가 지정된 JWT 토큰만 받고, 모든 백엔드 OAuth 자격증명은 AWS Secrets Manager가 보관하므로 클라이언트는 개별 에이전트 비밀번호를 보거나 관리하지 않습니다.

AWS 서버리스 A2A 게이트웨이: AI 에이전트 탐색 및 접근 제어

Amazon Web Services가 AI 에이전트 간의 탐색·라우팅·접근 제어를 중앙화하는 서버리스 A2A 게이트웨이 참조 아키텍처를 발표했습니다. 20개의 에이전트가 조율 없이 운영되면 최대 190개의 상호 연결이 생기는데, 게이트웨이는 이를 단일 진입점으로 줄입니다.

기업 내 AI 에이전트 수가 늘어날수록 중앙 조율 없이는 운영 혼란도 함께 커집니다. Amazon Web Services가 이 문제를 인프라 수준에서 해결하는 오픈 참조 아키텍처인 서버리스 A2A 게이트웨이를 발표했습니다.

에이전트 수가 늘어나면 왜 연결 문제가 생기는가?

문제는 단순하게 설명할 수 있지만 실제로는 심각합니다. 두 에이전트 간의 직접 연결마다 자체 인증, 자체 라우팅 로직, 자체 접근 제어가 필요합니다. N개의 에이전트가 있으면 최대 포인트-투-포인트 연결 수는 N×(N-1)/2입니다.

에이전트 10개면 45개의 연결입니다. 에이전트 20개 — 엔터프라이즈 배포에서 드문 일이 아닙니다 — 에서는 시스템이 최대 190개의 직접 연결을 필요로 할 수 있습니다. 각 연결에는 순환해야 하는 고유 자격증명, 고유 오류 처리 로직, 고유 인가 코드가 있습니다. 새 에이전트 하나를 추가하는 것이 그 자체로 프로젝트가 됩니다.

A2A 게이트웨이는 이를 단일 진입점으로 줄입니다.

3계층 아키텍처

관리 계층

관리 계층은 에이전트의 중앙 레지스트리를 유지하고 탐색을 가능하게 합니다. 각 에이전트가 한 번 등록되면 게이트웨이가 표준화된 경로 GET /agents/{agentId}/.well-known/agent-card.json에서 접근 가능한 agent-card.json을 자동으로 생성하고 캐시합니다. 카드의 URL은 게이트웨이 도메인으로 재작성되어 클라이언트가 백엔드와 직접 통신하지 않습니다.

에이전트 탐색은 두 가지 방식으로 작동합니다. 정확한 이름 매칭 또는 자연어 시맨틱 검색입니다. 에이전트 설명은 Amazon Bedrock Titan Text Embeddings로 인덱싱되어 Amazon S3 Vectors에 저장됩니다. 클라이언트가 정확한 이름 없이 「한국어로 계약을 분석하는 에이전트」 같은 쿼리를 보내면 시맨틱으로 관련된 에이전트 목록을 받을 수 있습니다.

제어 계층

제어 계층은 인가와 속도 제한을 관리합니다. 인증은 Amazon Cognito를 통한 OAuth 2.0 클라이언트 자격증명 흐름 기반으로, 클라이언트가 접근 가능한 특정 에이전트에 연결된 스코프를 담은 JWT 토큰을 받습니다.

Lambda 인가자가 모든 요청에서 JWT 스코프를 평가합니다. 속도 제한은 사용자-에이전트 조합 단위로 적용되며 Amazon DynamoDB의 원자적 카운터로 구현됩니다. 즉, 병렬 요청이 들어와도 DynamoDB의 원자적 연산 덕분에 한도를 우회할 수 없습니다.

실행 계층

실행 계층은 인가된 요청을 받고, AWS Secrets Manager에서 백엔드 자격증명을 가져오고, 대상 에이전트에 인증하고, 클라이언트에게 응답을 전달하는 프록시입니다. Lambda Web Adapter를 통한 Server-Sent Events 스트리밍도 지원하므로 클라이언트가 차단 없이 실시간으로 부분 응답을 받을 수 있습니다.

클라이언트 측의 제로 시크릿 모델

보안 설계의 핵심 원칙은 클라이언트가 백엔드의 어떤 비밀번호나 OAuth 시크릿에도 접근해서는 안 된다는 것입니다. 모든 백엔드 자격증명은 Secrets Manager가 단독으로 보관하며, 클라이언트는 제한된 시간 동안 유효한 스코프가 지정된 JWT 토큰으로 게이트웨이와만 통신합니다.

선택적 프라이빗 VPC 배포(게이트웨이와 모든 AWS 서비스가 퍼블릭 인터넷 없이 프라이빗 네트워크 내에서만 접근 가능)와 온프레미스 에이전트를 위한 AWS Direct Connect 연결과 결합하면 높은 보안 요구사항을 가진 엔터프라이즈 환경의 요건을 충족합니다.

구현은 오픈 A2A 프로토콜을 지원

게이트웨이는 서로 다른 공급업체의 AI 에이전트 간 상호운용성을 위한 오픈 표준인 A2A(Agent-to-Agent) 프로토콜을 명시적으로 구현합니다. JSON-RPC와 HTTP+REST 바인딩 모두 지원되므로 다양한 플랫폼에서 구축된 에이전트들이 클라이언트 측 변경 없이 동일한 게이트웨이를 통해 통신할 수 있습니다.

전체 인프라 코드는 Terraform 구성(버전 1.5.0 이상)으로 제공됩니다. Terraform이 에이전트 레지스트리용 DynamoDB 테이블, 권한 및 속도 제한 카운터, Cognito 사용자 풀, 모든 작업을 위한 Lambda 함수, API Gateway, IAM 역할을 자동으로 프로비저닝합니다. 프록시 Lambda 컨테이너의 Docker 빌드는 terraform apply 프로세스의 일부로 자동 실행됩니다.

실용적 맥락

이 참조 아키텍처는 프로덕션 준비가 완료된 서비스가 아니라 팀이 맞춤화할 수 있는 문서화된 패턴입니다. AWS는 게이트웨이가 조직이 자체 보안 계층, 모니터링, 도메인별 로깅을 추가하는 기반으로 설계되었음을 강조했습니다. 백엔드 자체가 프롬프트 인젝션 공격에 대한 방어를 구현해야 합니다. 게이트웨이는 에이전트에 접근할 수 있는 사람을 보장하지만 메시지 내용은 분석하지 않습니다.

AWS, 190개 포인트-투-포인트 연결을 중앙 레지스트리 하나로 대체하는 서버리스 A2A 게이트웨이 발표