OpenAI:AI模型推翻了离散几何学中存在80年的猜想
OpenAI宣布其AI模型解决了单位距离问题——这是离散几何学的核心猜想,自Paul Erdős于1946年提出以来悬而未决逾80年。公司将此结果描述为AI驱动数学研究的里程碑:模型不仅验证了既有命题,更通过构造反例将其推翻。
12 条新闻 — 🔴 3 重要 , 🟡 8 值得关注 , 🟢 1 有趣
OpenAI宣布其AI模型解决了单位距离问题——这是离散几何学的核心猜想,自Paul Erdős于1946年提出以来悬而未决逾80年。公司将此结果描述为AI驱动数学研究的里程碑:模型不仅验证了既有命题,更通过构造反例将其推翻。
被ICML 2026收录的arXiv预印本通过受控预训练实验表明,可执行代码本身并不能改善LLM模型的整体推理能力——代码大幅提升了编程能力,但在标准模式下与数学任务存在竞争关系。数学方面的真正进步来自跨领域结构化推理轨迹(代码-文本与数学-文本混合),对专家混合模型的机制分析在专家激活模式中揭示了这些交互关系。
Anthropic于2026年5月19日在Research Preview中发布了MCP Tunnels——允许Claude代理连接至用户私有网络中的Model Context Protocol服务器——以及作为Anthropic基础设施替代方案的自托管沙盒。更新还包括在活跃会话中动态更改MCP配置,以及超过10万Token的工具输出自动溢出到沙盒文件。
Google DeepMind于2026年5月19日发布Co-Scientist——这是一个基于Gemini的多代理AI系统,通过6个专门代理在"创意锦标赛"辩论中生成、讨论并改进科学假设。该系统与100余家研究机构合作开发,已在肝纤维化、ALS、细胞衰老和传染病研究中取得具体成果,将分析时间从数月压缩至数天。
Google在I/O 2026大会上发布了第二波重磅AI产品:Antigravity 2.0——以代理为核心的开发平台,配备CLI和SDK;Gemini Spark——持续在设备端后台运行的个人AI代理;Universal Cart——跨Google服务整合的AI购物助手。三款产品紧随Gemini 3.5 Flash和Gemini Omni发布(已在前次报道中覆盖),共同奠定了Google代理优先生态系统战略。
LangChain于2026年5月20日在Deep Agents框架中引入解释器——内置QuickJS运行时环境,允许代理在LLM工具调用之间编写和执行代码,无需将状态序列化到消息历史。公司称在某些任务上可节省高达35%的Token消耗,因为状态持久保存在运行时内而非模型上下文中,且默认不允许访问文件系统、网络或Shell,具有明确的可控动作空间。
AWS于2026年5月20日宣布,Amazon SageMaker AI的实时推理端点现已提供OpenAI兼容API——可直接替换OpenAI SDK、LangChain和Strands Agents,只需更改URL即可。端点通过/openai/v1路径提供Chat Completions和流式传输支持,身份验证使用从AWS凭据生成的时效性Bearer令牌。
Google DeepMind于2026年5月19日公布,其WeatherNext模型以80%的置信度提前整整5天准确预测了梅利莎飓风将达到5级——这是现代气象学中的首例。该模型使用50个并行情景的集合预报,上一季度被美国国家飓风中心评为飓风预报最高排名系统。