arXiv:2605.22763:AI智能体结合Lean验证解决9个开放Erdős问题和44个OEIS猜想
来自DeepMind和MIT CSAIL的20名研究人员组成的团队发布了首个关于LLM在Lean定理证明器中自主生成形式证明的大规模评估。该智能体将LLM生成与Lean符号验证相结合,自主解决了353个开放Erdős问题中的9个,并证明了492个OEIS猜想中的44个。
5 条新闻
来自DeepMind和MIT CSAIL的20名研究人员组成的团队发布了首个关于LLM在Lean定理证明器中自主生成形式证明的大规模评估。该智能体将LLM生成与Lean符号验证相结合,自主解决了353个开放Erdős问题中的9个,并证明了492个OEIS猜想中的44个。
当众多用户将AI用于创意任务时,他们都会获得相似的建议——「创意多样性崩溃」。研究人员引入了带有过度聚集系数Δ和多样性比率ρ的事前协议。三个接受测试的前沿模型在短篇故事、营销口号和替代用途任务中均跌破与人类的齐平阈值。
由Jiaxian Yan领导的研究团队于2026年4月23日发表了BioMiner——一个用于从科学文献中自动提取蛋白质-配体生物活性数据的多模态AI系统。该系统处理文本、表格和分子结构,在新基准BioVista(来自500篇论文的16,457条条目)上达到F1 0.32,并在演示应用中从11,683篇论文中提取了82,262条数据。
Google Photos新增了自动框架功能,该功能将2D照片解读为3D场景,评估几何结构和相机参数,然后使用潜在扩散模型生成原始画面之外的内容,从而实现替代构图。
研究人员推出了Camera Artist,一个模拟真实电影工作流程来生成叙事视频的多智能体系统。该系统协调专门的AI智能体模拟导演、摄影师和剪辑师,实现连贯的视觉叙事。