Claude Opus 4.8 모델의 컨텍스트 창은 얼마나 되나요?

Claude Opus 4.8은 Claude API, Amazon Bedrock, Google Vertex AI에서 기본 100만 토큰 컨텍스트 창을 지원하며, Microsoft Foundry에서는 한도가 200k 토큰입니다. 최대 출력 토큰 수는 128k입니다.

Claude Opus 4.8의 적응형 사고(adaptive thinking)란 무엇인가요?

적응형 사고는 구체적인 요청이 요구할 때만 추론 과정을 활성화하여, 동일한 노력(effort) 수준에서 Claude Opus 4.7 대비 불필요하게 소비되는 사고 토큰 수를 줄입니다.

대화 중간 시스템 메시지(mid-conversation system messages)란 무엇인가요?

role: 'system' 역할을 가진 메시지로, messages 배열 내에서 사용자 턴 이후에 보낼 수 있습니다. 베타 헤더 없이도 프롬프트 캐시 적중을 유지하면서 긴 세션 도중 지침을 변경할 수 있게 해줍니다.

Claude Opus 4.8: 100만 컨텍스트와 적응형 사고

Claude Opus 4.8은 Anthropic이 2026년 5월 28일 출시한 새로운 최고 성능의 일반 출시(GA) 모델이다. Claude API, Amazon Bedrock, Vertex AI에서 기본 100만(1M) 토큰 컨텍스트 창, 최대 128k 출력 토큰, 그리고 필요할 때만 추론을 활성화하는 적응형 사고 기능을 제공한다.

Anthropic은 2026년 5월 28일 자사의 최고 성능 일반 출시(GA — General Availability) 모델인 Claude Opus 4.8(모델 ID claude-opus-4-8)을 출시했다. 모델 자체와 함께, 프로덕션 애플리케이션에서 모델 동작에 대한 제어를 확장하는 일련의 부수적 API 기능들도 공개되었다.

Claude Opus 4.8은 어느 정도의 컨텍스트와 출력을 제공하나?

Claude Opus 4.8은 Claude API, Amazon Bedrock, Google Vertex AI에서 기본 100만(1M) 토큰 컨텍스트 창을 지원한다. Microsoft Foundry에서는 한도가 200k 토큰이다. 최대 출력 토큰 수는 128k이다. 이 모델은 이전 Claude Opus 4.7과 동일한 도구 및 플랫폼 기능 집합을 유지한다.

컨텍스트 창(context window)은 모델이 하나의 대화 도중 동시에 “작업 메모리”에 담아둘 수 있는 텍스트의 총량 — 프롬프트와 응답 모두 — 을 가리킨다.

Claude Opus 4.8은 적응형 사고를 어떻게 활용하나?

**적응형 사고(adaptive thinking)**가 켜진 상태에서 Claude Opus 4.8은 해당 턴이 요구할 때만 추론 과정을 실행하여, 동일한 노력 수준에서 Claude Opus 4.7 대비 헛되이 소비되는 사고 토큰 수를 줄인다. Claude Opus 4.8의 effort 파라미터는 이제 Claude Code와 Messages API를 포함한 모든 표면에서 기본적으로 high로 설정된다.

이로써 더 높은 응답 품질(높은 effort)과 더 적은 토큰 소비가 결합되는데, 모델이 단순한 작업에 추론 역량을 낭비하지 않기 때문이다.

출시와 함께 어떤 새로운 API 기능이 제공되나?

Anthropic은 동시에 **대화 중간 시스템 메시지(mid-conversation system messages)**를 도입했다. 이는 role: "system" 역할을 가진 메시지로, messages 배열 내에서 사용자 턴 이후에 보낼 수 있다(배치에 관한 규칙 포함). 이를 통해 프롬프트 캐시 적중을 잃지 않으면서 긴 세션 도중 지침을 변경할 수 있으며, 베타 헤더도 필요하지 않다.

거부(refusals)에 해당하는 응답의 stop_details 필드가 이제 공개적으로 문서화되었다. 이 필드는 category(cyber, bio 또는 null)와 사람이 읽을 수 있는 설명을 반환하므로, 애플리케이션은 서로 다른 종류의 거부를 적절한 다음 단계로 라우팅할 수 있다.

**프롬프트 캐싱(prompt caching)**을 위해 캐시할 수 있는 프롬프트의 최소 길이가 1,024 토큰으로 낮아졌는데, 이는 Claude Opus 4.7보다 낮은 값으로, 캐싱의 비용 효율을 더 짧은 프롬프트로 확장한다. 프롬프트 캐싱은 이미 처리된 프롬프트 부분을 저장하여 매 호출마다 다시 계산하지 않도록 하며, 시간과 비용을 모두 절약한다.

샘플링과 제약 조건에서는 어떻게 동작하나?

샘플링 파라미터 temperature, top_p 또는 top_k를 기본값과 다른 값으로 설정하면 Claude Opus 4.7과 마찬가지로 Claude Opus 4.8에서 400 오류를 반환한다. Anthropic은 이전 버전에서 전환할 때의 세부 사항에 대해 마이그레이션 가이드를 안내한다.

Claude Code에서 Max 플랜 사용자는 이제 Claude Opus 4.8에서 기본적으로 fast mode를 사용하며, 장기 작업을 위한 Auto mode가 더 많은 사용자에게 확대되었다. Workflows는 Claude Code에서 research preview로 제공되어, 다단계 에이전트 계획을 정의하고 실행할 수 있게 한다.

이것이 개발팀에게 의미하는 바는?

100만 컨텍스트, 적응형 사고, 그리고 거부에 대한 더 정교한 제어의 결합은 Claude Opus 4.8을 대용량 문서에 대한 까다로운 에이전트 및 분석 워크플로우용 모델로 자리매김한다. 이 모델은 Claude Opus 4.7과 마찬가지로 고해상도 이미지 입력(긴 변 기준 최대 2576픽셀), Task budgets, computer use 및 advisor tool도 지원한다.

Anthropic: Claude Opus 4.8, 100만 토큰 컨텍스트와 적응형 사고 기능 탑재

Claude Opus 4.8은 어느 정도의 컨텍스트와 출력을 제공하나?

Claude Opus 4.8은 적응형 사고를 어떻게 활용하나?

출시와 함께 어떤 새로운 API 기능이 제공되나?

샘플링과 제약 조건에서는 어떻게 동작하나?

이것이 개발팀에게 의미하는 바는?

자주 묻는 질문

출처

관련 뉴스