🤖 24 AI
🟢 🏥 실무 2026년 4월 18일 토요일 · 3 분 읽기

AWS, Amazon Bedrock에 IAM 주체별 세분화된 비용 귀속 도입

왜 중요한가

Amazon Bedrock은 이제 API를 호출하는 특정 사용자, 역할 또는 연합 ID인 IAM 주체별로 추론 비용을 추적합니다. 이 기능은 추가 비용 없이 AWS Cost and Usage Reports(CUR 2.0) 및 Cost Explorer와 통합됩니다. 직접 IAM 사용자, 애플리케이션 역할, 연합 인증 및 LLM 게이트웨이 프록시 패턴의 네 가지 접근 시나리오를 지원합니다. 모든 상용 AWS 리전에서 사용 가능합니다.

Amazon Web Services는 2026년 4월 17일 호스팅된 LLM 서비스 사용의 주요 기업 문제 중 하나를 해결하는 Amazon Bedrock의 새 기능을 발표했습니다: 누가 얼마나 소비했는가. 저자 Ba’Carri Johnson, Ajit Mahareddy, Sofian Hamiti, Vadim Omeltchenko는 이 기능이 가치를 제공하는 네 가지 아키텍처 시나리오를 상세히 다룹니다.

문제: 하나의 API, 많은 사용자

일반적인 기업 Bedrock 배포는 동일한 모델을 호출하는 수십 개의 팀과 수백 개의 애플리케이션을 가집니다. 클래식 AWS 청구서는 총 비용을 표시하지만 누가 생성하는지는 표시하지 않습니다——즉 CFO가 누가 무엇을 지불할지 결정할 수 없습니다.

새 기능은 IAM 주체——각 추론 호출을 시작한 특정 IAM 사용자, 역할 또는 연합 ID——를 추적함으로써 이를 해결합니다.

작동 방식

CUR 2.0(Cost and Usage Reports)의 line_item_iam_principal 열이 ID의 ARN을 표시합니다. 데이터는 직접 AWS Cost Explorer로 흐르며 여기서 필터링, 그룹화, 시각화할 수 있습니다.

전체 솔루션은 추가 비용 없이 그리고 추가 인프라 없이 작동합니다——기존 IAM 메커니즘을 사용합니다.

선택적 태깅

더 높은 수준에서 집계하기 위해 조직은 IAM 리소스에 비용 할당 태그를 추가할 수 있습니다:

  • 주체 태그 — 사용자 또는 역할에 영구적으로 할당
  • 세션 태그 — AssumeRole 중 동적으로 전달되거나 ID 공급자 어설션에서 가져옴

태그가 지정된 데이터는 iamPrincipal/ 접두사와 함께 Cost Explorer로 흐르며, 팀, 프로젝트, 비용 센터 또는 사용자 정의 차원으로 그룹화할 수 있습니다.

네 가지 기업 시나리오

시나리오 1——직접 IAM 접근

개인 개발자가 IAM 자격 증명이나 API 키를 사용합니다. 귀속은 직접적입니다. 팀은 부서별 차지백을 위해 사용자에게 메타데이터(부서, 비용 센터)로 태그를 지정합니다.

시나리오 2——애플리케이션 접근

AWS 인프라(Lambda, EC2, ECS)에서 실행되는 각 서비스가 자체 IAM 역할을 가정합니다. Assumed-role ARN이 자동으로 애플리케이션별 비용을 기록하며, 프로젝트 롤업을 위한 선택적 태그가 있습니다.

시나리오 3——연합 인증

사용자가 기업 ID 공급자(Okta, Azure AD, Auth0)를 통해 인증하고 공유된 IAM 역할을 가정합니다. ARN의 세션 이름이 개별 사용자를 식별합니다. IdP의 세션 태그가 사용자별 IAM 리소스 관리 없이 팀/비용 센터 정보를 가져옵니다.

시나리오 4——LLM 게이트웨이 프록시

가장 복잡합니다. API 게이트웨이가 사용자와 Bedrock 사이에 위치할 때, 사용자별 가시성은 게이트웨이가 각 사용자에 대해 고유한 세션 이름과 태그로 AssumeRole을 호출해야 합니다. 멀티 테넌트 SaaS 배포에서 테넌트 수준 또는 사용자 수준 비용 격리를 가능하게 합니다.

이것이 SaaS 구축이 실제로 필요로 하는 패턴입니다——지금까지는 커스텀 솔루션으로 해결해야 했습니다.

구현 단계

AWS는 명확한 5단계 흐름을 문서화합니다:

  1. 아키텍처 패턴 식별(시나리오 1-4)
  2. CUR 2.0 구성에서 IAM 주체 데이터 활성화
  3. IAM 리소스에 태그를 적용하거나 IdP 세션 태그 전달 구성
  4. AWS Billing 콘솔에서 비용 할당 태그 활성화
  5. 24~48시간 내에 Cost Explorer에서 비용 검토

기능 특성

  • 추가 인프라 없음 — 기존 IAM 메커니즘으로 작동
  • 멀티 모델 지원 — Claude, Nova 및 기타 Bedrock 모델
  • 토큰 수준 세분성 — 호출자별 개별 입력 및 출력 토큰 비용
  • SaaS 지원 — 세션 기반 ID를 통한 멀티 테넌트

모든 상용 AWS 리전에서 추가 비용 없이 사용 가능합니다.

배경

기업 LLM 채택은 근본적으로 “누가 어떤 호출을 지불하는가”라는 문제로 막혀 있었습니다. 전체 재무 흐름을 측정할 수 없으면 재무 부서 앞에서 AI 프로젝트를 정당화하기 어렵습니다. AWS는 이를 통해 주요 비기술적 차단 요소 중 하나를 해결했습니다——이는 대부분의 새 모델보다 더 유용한 움직임입니다.

🤖

이 기사는 AI가 1차 출처를 기반으로 생성했습니다.