BioMysteryBench:Mythos Preview が専門家でも解けないバイオインフォマティクス問題を解決、Opus 4.6 は人間が解ける課題で 77.4% を達成
Anthropic は 2026 年 4 月 29 日に BioMysteryBench を発表しました。これは実験データの客観的なグラウンドトゥルースを用いた、99 問の専門的なバイオインフォマティクス課題からなる評価フレームワークです。Claude Opus 4.6 は人間が解ける 76 問で約 77.4% の精度を、23 問の超人間的な課題で 23.5% を達成しています。一方、Mythos Preview は人間の専門家パネルでも解けなかった問題を解決しており、研究者たちはこれを生命科学における AI の転換点と表現しています。