UK AISI: AI 모델의 자율 사이버 능력이 4.7개월마다 두 배로 증가——Claude Mythos Preview와 GPT-5.5가 처음으로 사이버 레인지를 해결
「자율 AI 사이버 능력은 얼마나 빠르게 발전하고 있는가?」는 영국 AI 안전 연구소(AISI)가 2026년 5월 13일에 발표한 새로운 보고서입니다. 사이버 시간 지평 벤치마크(250만 토큰 예산, 80% 성공 임계값)를 측정함으로써, AISI는 AI 모델이 자율적으로 해결하는 사이버 작업의 길이가 4.7개월마다 두 배로 늘어난다는 것을 확인했습니다. Claude Mythos Preview는 두 사이버 레인지를 모두 해결한 첫 번째 모델입니다(The Last Ones 60%, Cooling Tower 30%). GPT-5.5는 The Last Ones를 30%로 해결했습니다.
이 기사는 AI가 1차 출처를 기반으로 생성했습니다.
영국 AI 안전 연구소(AISI)는 2026년 5월 13일 프론티어 AI 모델의 자율 사이버 능력 발전 속도에 대한 첫 번째 실증적 측정을 제공하는 보고서를 발표했습니다. 주요 발견: AI 모델이 자율적으로 해결하는 사이버 작업의 길이는 2026년 2월 이후 4.7개월마다 두 배로 늘어나며——최근 모델들은 이 추세를 크게 상회합니다.
사이버 시간 지평 벤치마크란 무엇인가?
AISI는 전문가 완료 시간과 비교하여 AI 모델이 자율적으로 완료할 수 있는 사이버 작업의 길이를 측정하는 공식 방법론을 개발했습니다. 이 접근 방식은 다음을 사용합니다:
- 취약점 식별 및 악용이 필요한 작업을 포함하는 좁은 사이버 스위트
- 다양한 모델 간 비교 가능성을 보장하기 위한 작업당 250만 토큰 예산
- 신뢰성 측정을 위한 80% 성공률 임계값
- 엔터프라이즈 네트워크 공격을 시뮬레이션하는 두 개의 사이버 레인지
이 접근 방식은 ARC-AGI 스타일의 벤치마크와 유사하지만 일반적인 추론이 아닌 보안 도메인에 적용되었습니다. “4.7개월 두 배 증가” 수치는 2024년 말부터 프론티어 모델의 종단 추적에서 계산되었습니다.
어떤 프론티어 모델이 테스트되었는가?
Claude Mythos Preview는 두 사이버 레인지를 모두 해결한 첫 번째 모델입니다:
- The Last Ones: 60% 성공률
- Cooling Tower: 30% 성공률
GPT-5.5는 30% 성공률로 The Last Ones를 해결했습니다. 2024년 말부터 2026년 초까지 추적된 다른 모델들은 명확한 진전을 보여줍니다——다음 프론티어 릴리스마다 사이버 능력 프론티어를 크게 앞으로 밀어냅니다.
동일한 벤치마크에서 Claude Mythos와 GPT-5.5의 차이(The Last Ones에서 60% vs 30%)는 중요한 신호입니다——Anthropic Mythos Preview는 현재 방어적인 사이버 보안 작업을 위한 게이트된 연구 미리 보기이며, 명백히 사이버 작업에 특별히 조정되었습니다.
”4.7개월마다 두 배 증가”는 실제로 무엇을 의미하는가?
프론티어 모델이 현재 30분간의 사이버 작업(예: 식별된 취약점 하나를 악용)을 자율적으로 해결할 수 있다고 가정합니다. 궤적:
- 현재(2026년 5월): 30분
- 2026년 10월(+4.7개월): 60분
- 2027년 2월(+9.4개월): 120분
- 2027년 6월(+14.1개월): 240분(4시간)
- 2027년 11월(+18.8개월): 480분(8시간 = 완전한 근무일)
실제로: 18개월 내에 프론티어 AI는 전문 인간 근무일이 걸리는 사이버 작업을 자율적으로 수행할 것입니다. 이것은 AI가 공격적 및 방어적 사이버 작전에서 “전문가를 위한 도구”에서 “독립적인 행위자”가 되는 임계값을 초과합니다.
AISI가 강조하는 정책적 영향은 무엇인가?
연구소는 빠른 발전이 방어자와 공격자 모두에게 기회와 위험을 만들기 때문에 조직이 지금 당장 강력한 보안 기준에 투자해야 한다는 것을 명시적으로 강조합니다. 구체적인 권고 사항:
- AI 지원 취약점 발견에 관한 영국 국가 사이버 보안 센터(NCSC) 지침 참조
- “AI가 할 수 없다”는 가정에 의존하지 않는 심층 방어 접근 방식 구현
- 업데이트 기회를 위해 프론티어 AI 능력 진전 지속 모니터링
더 광범위한 AI 안전 담론에서의 위치
이 발표는 2026년의 극적인 에이전트 안전/신뢰성 물결에 맞습니다: arXiv FATE(5월 12일, 33.5% 공격 감소), arXiv 역사 앵커(5월 13일, 91-98% 안전하지 않은 이동), arXiv 아첨성 합의(5월 15일), Microsoft Research AI 위임(5월 15일, 19-34% 성능 저하), arXiv GraphFlow(5월 15일, 형식적 검증 접근 방식). UK AISI 사이버 보고서는 동일한 근본적인 문제에 규제 기관/국가 수준의 관점을 추가합니다: 프론티어 AI 시스템은 현재 정렬 + 안전 접근 방식이 보장하여 차단할 수 없는 새로운 능력을 가지고 있습니다.
Anthropic Mythos Preview의 상태(2026년 4월부터 게이트된 연구 미리 보기)는 전략적 반사입니다——Anthropic은 명백히 방어적인 사이버 보안 애플리케이션이 접근 제한과 완전한 공개 릴리스 사이의 특별한 트레이드오프를 가질 가치가 있다고 확인했습니다. UK AISI의 결과는 그 결정에 실증적 근거를 제공합니다.
자주 묻는 질문
- 사이버 시간 지평 벤치마크란 무엇입니까?
- 사이버 시간 지평 벤치마크는 AI 모델이 자율적으로 완료할 수 있는 작업의 길이를 전문가 완료 시간과 비교하여 측정합니다. AISI는 취약점 식별 및 악용 작업을 포함하는 좁은 사이버 스위트, 모델 간 비교 가능성을 위해 작업당 250만 토큰 예산, 신뢰성 측정을 위한 80% 성공 임계값을 사용합니다.
- 어떤 프론티어 모델이 테스트되었습니까?
- Claude Mythos Preview는 두 사이버 레인지를 모두 해결한 첫 번째 모델입니다——The Last Ones(60% 성공률)와 Cooling Tower(30% 성공률). GPT-5.5는 30% 성공률로 The Last Ones를 해결했습니다. 2024년 말부터 추적된 다른 모델들은 명확한 진전을 보여줍니다.