arXiv:2605.22763:AI エージェントがLean検証で9つの開放Erdős問題と44のOEIS予想を解決
DeepMindとMIT CSAILから20名の研究者が参加するチームが、Lean定理証明器でのLLMによる形式的証明の自律的生成に関する最初の大規模評価を発表しました。エージェントはLLM生成とLeanによる記号的検証を組み合わせ、353の開放Erdős問題のうち9つを自律的に解決し、492のOEIS予想のうち44を証明しました。
5 件
DeepMindとMIT CSAILから20名の研究者が参加するチームが、Lean定理証明器でのLLMによる形式的証明の自律的生成に関する最初の大規模評価を発表しました。エージェントはLLM生成とLeanによる記号的検証を組み合わせ、353の開放Erdős問題のうち9つを自律的に解決し、492のOEIS予想のうち44を証明しました。
多くのユーザーがAIをクリエイティブなタスクに使用すると、全員が似たような提案を受け取ります——「アイデア多様性崩壊」。研究者らは過剰集中係数Δと多様性比率ρを持つ事前プロトコルを導入しました。テストされた3つのフロンティアモデルは全て、短編小説、マーケティングスローガン、代替用途タスクで人間との同等閾値を下回りました。
Jiaxian Yanらの研究チームは2026年4月23日にBioMinerを発表しました——科学文献からタンパク質-リガンド生物活性データを自動抽出するマルチモーダルAIシステムです。テキスト、表、分子構造を処理し、新しいベンチマークBioVista(500論文から16,457エントリ)でF1 0.32を達成。デモアプリケーションでは11,683論文から82,262件のデータを抽出しました。
Google PhotosがAuto Frame機能を追加しました。2D写真を3Dシーンとして解釈し、幾何学とカメラパラメータを推定した後、潜在拡散モデルを使用して元のフレーム外のコンテンツを生成し、別の構図を実現します。
研究者がCamera Artistを発表しました。実際の映画制作ワークフローをモデル化してナラティブ動画を生成するマルチエージェントシステムです。監督、撮影監督、編集者をシミュレートする専門AIエージェントを連携させ、一貫したビジュアルストーリーテリングを実現します。