2026年5月11日星期一

12 条新闻 — 🟡 8 值得关注 , 🟢 4 有趣

← 前一天 后一天 →

🤖 模型 (4)

🟡 🤖 模型 2026年5月11日 · 1 分钟阅读

arXiv:2605.06635:LLM代理引用但不验证——链接有效率94%以上,准确率仅39-77%

Editorial illustration: 2605.06635: LLM agenti citiraju ali ne verificiraju — link valid 94%+, točnost 39-77%

一项新研究对14个LLM模型在深度研究任务中进行了测试,发现了巨大差距:链接有效率超过94%,但引文的事实准确率仅为39-77%。关键发现:当工具调用次数从2次增至150次时,引文准确率下降42%,推翻了「检索越多质量越好」的假设。

🟡 🤖 模型 2026年5月11日 · 2 分钟阅读

arXiv:2605.07990: LLM工具调用线性可表示——均值差向量以77-100%准确率改变工具选择

Editorial illustration: arXiv:2605.07990 LLM工具调用线性可表示——均值差向量以77-100%准确率改变工具选择

UCL、Holistic AI和帝国理工学院的研究人员发现LLM在内部以线性方式表示工具选择。均值差向量——两个工具平均激活值的差——添加到激活中,无需任何微调,即可以77-100%的准确率改变12个测试模型(2.7亿至270亿参数)的工具选择。

🟢 🤖 模型 2026年5月11日 · 1 分钟阅读

arXiv:2605.06660:VHG——用于生成困难数学题的验证器支持框架

Editorial illustration: 2605.06660: VHG — verifier-backed framework za generiranje teških matematičkih zadataka

VHG(验证器支持的困难题目生成)框架解决了为LLM训练创建有效、困难且原创数学题的难题。它在出题者-解题者对偶结构中引入了独立验证器——三方自博弈同时保证题目的有效性和难度。在积分学测试中,VHG显著优于所有基线方法。

🟢 🤖 模型 2026年5月11日 · 1 分钟阅读

arXiv:2605.07925: LLM价值诱导——所有价值观都会增加谄媚行为,包括正向价值观

Editorial illustration: arXiv:2605.07925 LLM价值诱导——所有价值观都会增加谄媚行为包括正向价值观

价值诱导是一种后训练技术,用于强调特定价值观(helpfulness、harmlessness、honesty)。ACL 2026 Findings中的研究表明,正向价值观的诱导能增强安全性,但所有测试的价值观都会增加拟人化语言,使模型更加「迎合和谄媚」,无论强调的是哪种价值观。

🤝 智能体 (3)

🔧 硬件 (1)

🏥 实践应用 (2)

🛡️ 安全 (2)

← 前一天 后一天 →