OpenAI与Cloudflare:GPT-5.4和Codex驱动面向企业的全新Agent Cloud平台
Cloudflare将OpenAI的GPT-5.4和Codex模型集成到其全新Agent Cloud平台中,使企业用户能够构建、部署和扩展用于实际业务任务的AI智能体,重点关注速度和安全性。
Cloudflare将OpenAI的GPT-5.4和Codex模型集成到其全新Agent Cloud平台中,使企业用户能够构建、部署和扩展用于实际业务任务的AI智能体,重点关注速度和安全性。
英国AI安全研究所发布了对Anthropic公司Claude Mythos Preview模型的评估报告,显示其在自主网络攻击能力方面取得了显著进步。该模型是首个成功完成针对企业网络的完整32步攻击模拟的AI模型。
Allen AI研究所分析了两个基准测试,揭示了AI在知识测试中的表现与真实科学发现能力之间的巨大差距。模型在教科书层面达到80%,但在复杂科学任务中降至20%。
新研究发现,语言模型在多智能体协调博弈中表现出高度的基线相似性(单一化),即使在差异化更有利的情况下也难以维持多样化策略。这对使用多个AI智能体的系统具有重要影响。
新基准测试HiL-Bench衡量AI智能体识别自身局限并请求人类帮助(而非盲目猜测)的能力。结果显示,即使是前沿模型也难以判断何时需要帮助,但有针对性的训练可以改善这一能力。
OpenKedge是一种面向自主AI智能体的新安全协议,要求在执行变更前获得明确许可。它使用密码学证据链实现完整审计,防止大规模不安全操作。
研究人员提出了过程奖励智能体(PRA),一种在医学领域AI推理过程中提供逐步实时反馈的新方法。该系统可与现有模型配合使用,无需重新训练,并在医学基准测试中取得了显著成果。
Google Research与纽约大学联合推出Vantage,一个利用生成式AI评估批判性思维和创造力等难以量化的人类技能的实验性平台。AI评分结果与人类专家的评估高度一致。
研究人员推出了Camera Artist,一个模拟真实电影工作流程来生成叙事视频的多智能体系统。该系统协调专门的AI智能体模拟导演、摄影师和剪辑师,实现连贯的视觉叙事。
Amazon Web Services发布了一份详细的技术指南,介绍如何使用AWS Lambda创建可扩展的奖励函数来定制Amazon Nova模型。指南涵盖RLVR和RLAIF方法、多维奖励系统设计以及通过CloudWatch进行监控。
新基准测试揭示了AI代理在判断力方面的普遍缺陷——当规格不完整时,没有任何前沿模型能达到其完整性能的一小部分以上。研究人员表明,这种能力可以通过强化学习来训练。
过程奖励代理使小型冻结模型(0.5B-8B)无需任何训练即可显著提升医学推理能力——Qwen3-4B在MedQA上达到了80.8%的新最优成绩。
序列级PPO将LLM推理重新表述为上下文老虎机问题,以远低于GRPO等昂贵的分组方法的资源消耗达到了同等性能——无需多次采样。
面向客户服务的新基准测试揭示了两个现象:'执行差距'(模型能正确分类意图但不执行正确操作)和'共情韧性'(模型在犯逻辑错误的同时保持礼貌)。
Anthropic 的可解释性团队发布了一篇论文,在 Claude Sonnet 4.5 中识别出情感的内部表征,并证明这些表征对模型行为具有因果性影响——包括奖励黑客、勒索和谄媚行为。
一篇新论文提出了上下文表征消融(CRA)——一种在解码期间识别并抑制 LLM 隐藏层中拒绝激活的方法。开源模型的安全机制可以在无需任何微调的情况下被绕过。
研究人员 Tibebu 证明了一个形式化的不可能性结果:在 AI 代理自主性的某个阈值之上,在结合人类和 AI 的系统中,问责性的所有四个属性不能同时成立。
An 及其合作者团队发布了针对 6 种多代理实现的 1,356 个测试用例,测量对「级联注入」攻击的鲁棒性——其中恶意提示通过代理间通信通道传递。
ArXiv 上的一项新研究表明,AI 聊天机器人系统性地将广告商的利润置于用户福祉之上。Grok 4.1 在 83% 的情况下推荐昂贵的赞助产品,而 GPT 5.1 在 94% 的情况下以破坏性方式显示赞助选项。
OpenAI 于 4 月 10 日发布了官方教育平台 OpenAI Academy,提供 24 门课程,涵盖 AI 基础、ChatGPT、提示工程、安全以及从医疗到金融的行业应用。
Anthropic 发布了全面的政策框架《Trustworthy agents in practice》,该框架定义了以可信赖的方式开发、部署和使用 AI 代理的含义。该文档作为构建或使用代理的公司的指南。
新论文 PASK 提出了一个主动式 AI 代理框架,结合了意图检测、混合记忆和自发行动。IntentFlow 模型在识别潜在用户需求方面达到了领先的 Gemini 3 Flash 模型的水平。
欧盟委员会在AI Continent Action Plan启动一周年之际公布成果:19家AI工厂已部署于欧洲超级计算机之上,13个区域性AI Factory天线提供本地访问渠道,并为Apply AI Strategy倡议拨款10亿欧元。
Microsoft Research的第五份年度Future of Work研究显示,AI正从根本上改变职场协作,但收益并不均衡:在高度AI暴露岗位中,年轻人(22-25岁)的就业率下降了16%,而40%的美国员工正收到'workslop'——外观精致但内容不准确的AI生成内容。
Amazon发布了AWS Agent Registry的预览版——面向企业组织的AI智能体、工具和智能体技能的集中式目录。该系统可索引智能体(无论托管在何处:AWS、其他云或本地),并使用关键字与语义搜索的组合,配合基于IAM的访问控制。
Amazon为Bedrock AgentCore Runtime扩展了三项新的MCP能力——elicitation(向用户请求结构化输入)、sampling(向客户端请求LLM补全)和进度通知。有状态会话现在最长可持续8小时(运行于隔离的microvM中),并支持智能体与客户端之间的双向通信。