AWS: Nova 2 Lite와 Claude — 스캔 문서 처리를 위한 비용 최적화 파이프라인
AWS는 Amazon Bedrock에서 스캔 문서의 대량 디지털화를 위한 2단계(two-stage) 파이프라인 아키텍처를 시연합니다. Amazon Nova 2 Lite가 빠르고 저렴하게 초기 추출을 수행하고, Claude가 공간적으로 복잡한 이해를 담당합니다 — 단일 모델 대안보다 비용이 약 67% 절감되는 하이브리드 접근 방식입니다.
이 기사는 AI가 1차 출처를 기반으로 생성했습니다.
AWS는 Amazon Bedrock 플랫폼에서 스캔 문서의 대량 디지털화를 위한 2단계(two-stage) 파이프라인 접근 방식의 아키텍처를 발표했습니다. 시연은 복잡한 레이아웃을 가진 학교 연감을 사용하지만, 시각적 요소를 텍스트 데이터와 연결해야 하는 대용량 문서화 시나리오에 적용 가능합니다.
2단계 파이프라인 작동 방식
2단계 파이프라인은 두 모델이 순차적으로 작동하는 아키텍처 패턴입니다 — 저렴한 모델이 일상적인 처리를 담당하고, 비싼 모델이 가장 까다로운 단계만 처리합니다. 이 경우 Amazon Nova 2 Lite는 단일 API 호출로 각 스캔 페이지를 통과합니다: 바운딩 박스로 사진을 감지하고, 페이지의 위치와 함께 보이는 이름을 추출하고, 페이지 수준 메타데이터를 출력합니다. Nova 2 Lite는 비용을 예측 가능하게 유지하기 위해 낮은 추론 수준(LOW reasoning level)에서 작동합니다 — 해상도에 관계없이 이미지당 고정 비용.
업무 분담: Nova 2 Lite 대 Claude
Claude Sonnet 4.6은 두 번째 단계에서 Nova 2 Lite가 해결하지 못한 것을 처리합니다: 페이지의 특정 얼굴에 이름을 연결하는 공간적(spatial) 추론. Claude는 적응형 사고를 사용하며 각 레이아웃 유형에 대한 수동 프롬프트 엔지니어링 없이 입력의 복잡성에 따라 추론 깊이를 조정합니다. Nova 2 Lite는 페이지당 약 1,000개의 출력 토큰을 생성하고, Claude는 약 1,700개의 토큰을 소비합니다.
비용 계층화 접근 방식이 비용에 가져다주는 것은?
핵심은 Claude를 필요한 곳에만 사용한다는 것입니다. 결과: 2단계 파이프라인은 페이지당 약 $0.033이 드는 반면, Claude만 처리하면 약 $0.10이 됩니다. 100,000페이지에서 차이는 약 $6,500입니다. AWS는 336개 연감 페이지에서 3,122개의 이름-얼굴 연결 샘플에서 정확도를 테스트합니다 — 93.3%가 신뢰도 ≥ 0.95를 받고 0.3%만 0.90 미만으로 떨어집니다.
이 패턴이 어디에 더 적용될 수 있나?
연감 외에도, 동일한 아키텍처 패턴이 역사적 아카이브, 직원 명부, 부동산 등기, 제품 카탈로그에 적용됩니다. 문서 처리에 명확한 『쉬운』 부분과 『어려운』 부분이 있는 모든 시나리오는 비용 계층화 다중 모델 파이프라인의 후보입니다: Amazon Nova 2 Lite에 일상적인 작업을 맡기고, 공간적·의미론적으로 까다로운 단계는 Claude에게 위임하십시오.
자주 묻는 질문
- 2단계 파이프라인은 Claude만 사용하는 것보다 얼마나 저렴한가요?
- 약 67% 더 저렴합니다 — 2단계 파이프라인은 페이지당 약 $0.033이 드는 반면, 단일 모델 Claude 접근 방식은 약 $0.10입니다. 100,000페이지에서 절약액은 약 $6,500입니다.
- 이 접근 방식의 적합한 사용 사례는 무엇인가요?
- 학교 연감(연감 페이지) 외에도, 이 접근 방식은 관련 텍스트 추출과 함께 시각적 요소 감지가 필요한 역사적 아카이브, 직원 명부, 부동산 목록, 제품 카탈로그에 적용 가능합니다.