BioMysteryBench:Mythos Preview, 전문가도 풀지 못한 생물정보학 문제 해결, Opus 4.6은 인간 해결 과제에서 77.4% 달성
Anthropic은 2026년 4월 29일 BioMysteryBench를 공개했습니다. 이는 실험 데이터의 객관적인 정답을 활용한 99개의 전문 생물정보학 과제로 구성된 평가 프레임워크입니다. Claude Opus 4.6은 인간이 풀 수 있는 76개 문제에서 약 77.4%, 23개의 초인간적 과제에서 23.5%를 달성했으며, Mythos Preview는 인간 전문가 패널이 풀지 못한 문제들을 해결했습니다. 연구자들은 이를 AI가 생명과학 분야에서 이룬 분수령적 순간으로 묘사하고 있습니다.