🤖 24 AI

今日AI动态

🟡 🛡️ 安全 2026年4月14日 · 1 分钟阅读

ArXiv:算法单一化——大语言模型在需要差异化时却不会分化

新研究发现,语言模型在多智能体协调博弈中表现出高度的基线相似性(单一化),即使在差异化更有利的情况下也难以维持多样化策略。这对使用多个AI智能体的系统具有重要影响。

🟡 🤝 智能体 2026年4月14日 · 1 分钟阅读

ArXiv HiL-Bench:AI智能体知道何时该向人类求助吗?

新基准测试HiL-Bench衡量AI智能体识别自身局限并请求人类帮助(而非盲目猜测)的能力。结果显示,即使是前沿模型也难以判断何时需要帮助,但有针对性的训练可以改善这一能力。

🟡 🛡️ 安全 2026年4月14日 · 1 分钟阅读

ArXiv OpenKedge:要求AI智能体每次操作前获得许可的密码学协议

OpenKedge是一种面向自主AI智能体的新安全协议,要求在执行变更前获得明确许可。它使用密码学证据链实现完整审计,防止大规模不安全操作。

🟡 🤖 模型 2026年4月14日 · 1 分钟阅读

ArXiv:过程奖励智能体——实时反馈无需重新训练即可改善AI医学推理

研究人员提出了过程奖励智能体(PRA),一种在医学领域AI推理过程中提供逐步实时反馈的新方法。该系统可与现有模型配合使用,无需重新训练,并在医学基准测试中取得了显著成果。

🟡 🏥 实践应用 2026年4月14日 · 1 分钟阅读

Google Research:Vantage——通过与AI虚拟角色对话评估批判性思维和创造力的AI平台

Google Research与纽约大学联合推出Vantage,一个利用生成式AI评估批判性思维和创造力等难以量化的人类技能的实验性平台。AI评分结果与人类专家的评估高度一致。

🟢 ✨ 趣闻 2026年4月14日 · 1 分钟阅读

ArXiv Camera Artist:运用电影语言生成视频的多智能体AI系统

研究人员推出了Camera Artist,一个模拟真实电影工作流程来生成叙事视频的多智能体系统。该系统协调专门的AI智能体模拟导演、摄影师和剪辑师,实现连贯的视觉叙事。

🟢 🏥 实践应用 2026年4月14日 · 1 分钟阅读

AWS:如何使用Lambda构建奖励函数来微调Amazon Nova模型

Amazon Web Services发布了一份详细的技术指南,介绍如何使用AWS Lambda创建可扩展的奖励函数来定制Amazon Nova模型。指南涵盖RLVR和RLAIF方法、多维奖励系统设计以及通过CloudWatch进行监控。

昨天 2026年4月13日

更早的新闻

2026年4月12日星期日

10 条新闻 →

2026年4月11日星期六

8 条新闻 →

2026年4月10日星期五

10 条新闻 →
🔴 ⚖️ 监管 2026年4月10日 · 1 分钟阅读

EU AI Office发布首份年度报告:19家AI工厂与10亿欧元推动AI应用

欧盟委员会在AI Continent Action Plan启动一周年之际公布成果:19家AI工厂已部署于欧洲超级计算机之上,13个区域性AI Factory天线提供本地访问渠道,并为Apply AI Strategy倡议拨款10亿欧元。

🔴 💬 社区 2026年4月10日 · 2 分钟阅读

Microsoft Research:AI正快速改变工作,但收益不均——年轻人岗位减少16%

Microsoft Research的第五份年度Future of Work研究显示,AI正从根本上改变职场协作,但收益并不均衡:在高度AI暴露岗位中,年轻人(22-25岁)的就业率下降了16%,而40%的美国员工正收到'workslop'——外观精致但内容不准确的AI生成内容。

🟡 🤝 智能体 2026年4月10日 · 2 分钟阅读

AWS Agent Registry:企业级AI智能体目录进入预览阶段

Amazon发布了AWS Agent Registry的预览版——面向企业组织的AI智能体、工具和智能体技能的集中式目录。该系统可索引智能体(无论托管在何处:AWS、其他云或本地),并使用关键字与语义搜索的组合,配合基于IAM的访问控制。

🟡 🤝 智能体 2026年4月10日 · 2 分钟阅读

AWS Bedrock AgentCore:有状态MCP客户端支持交互式AI工作流

Amazon为Bedrock AgentCore Runtime扩展了三项新的MCP能力——elicitation(向用户请求结构化输入)、sampling(向客户端请求LLM补全)和进度通知。有状态会话现在最长可持续8小时(运行于隔离的microvM中),并支持智能体与客户端之间的双向通信。