2026年5月20日星期三

18 条新闻 — 🔴 2 重要 , 🟡 10 值得关注 , 🟢 6 有趣

← 前一天 后一天 →

🤖 模型 (4)

📦 开源 (1)

⚖️ 监管 (3)

🤝 智能体 (7)

🟡 🤝 智能体 2026年5月20日 · 2 分钟阅读

Anthropic Claude Code:v2.1.145版本带来实时会话脚本化与安全修复

Editorial illustration:

Claude Code v2.1.145新增JSON格式实时会话列表输出功能,扩展了OTEL追踪属性以跟踪智能体,并修复了Bash命令授权时的安全漏洞。可通过npm install -g @anthropic-ai/claude-code获取更新。

🟡 🤝 智能体 2026年5月20日 · 2 分钟阅读

Anthropic:Claude服务KPMG全球138个国家的276,000名员工

Editorial illustration: Anthropic i KPMG sklopili su stratešku globalnu alijansu kojom Claude dobiva pristup svim zaposlenic

Anthropic与KPMG签署战略全球联盟,Claude将覆盖全球四大会计师事务所之一的全体员工。Claude将集成至KPMG数字网关平台,KPMG同时成为Anthropic在私募股权领域的首选合作伙伴。

🟡 🤝 智能体 2026年5月20日 · 2 分钟阅读

AWS:Amazon Nova Sonic可扩展语音智能体的三种架构模式

Editorial illustration:

AWS发布了使用Amazon Nova Sonic和AgentCore Gateway构建可扩展语音智能体的详细指南。三种架构模式——直接工具、子智能体和会话分段——提供不同的延迟与操作复杂性权衡。

🟡 🤝 智能体 2026年5月20日 · 2 分钟阅读

GitHub Copilot接入Gemini 3.5 Flash:为日常编程带来速度与质量

Editorial illustration: Google-ov Gemini 3.5 Flash model postaje općenito dostupan za sve GitHub Copilot planove. Obećava kv

Google的Gemini 3.5 Flash模型正式面向所有GitHub Copilot计划全面开放。该模型承诺以Flash层级的速度和更低成本提供接近Pro级别的代码质量,并特别强调对智能体工作流和多IDE环境的支持。

🟢 🤝 智能体 2026年5月20日 · 1 分钟阅读

arXiv:2605.18703:EnvFactory——以1/5的环境数量训练工具调用智能体,性能提升15%

Editorial illustration:

EnvFactory是一种自动合成可执行训练环境的新框架,专为工具调用智能体设计。在Qwen3模型上,仅使用85个验证环境即可在BFCLv3上实现+15%、在MCP-Atlas上实现+8.6%的提升——比同类方法少五倍的环境数量。

🟢 🤝 智能体 2026年5月20日 · 1 分钟阅读

arXiv:2605.18565:LongMINT——揭示AI智能体为何「遗忘」所有信息

Editorial illustration:

LongMINT是首个测量AI智能体在长期动态场景中记忆管理能力的基准。包含15,600个问答对,上下文最长达180万个token,被测系统平均准确率仅为27.9%——在大量案例中低于随机猜测。

🟢 🤝 智能体 2026年5月20日 · 2 分钟阅读

arXiv:2605.20173:生产级LLM智能体的6种架构模式

Editorial illustration: Novi arXiv rad uvodi stochastic-deterministic boundary kao temeljni dizajn princip produkcijskih LLM

新发布的arXiv论文引入「随机-确定性边界」作为生产级LLM智能体的核心设计原则,并定义了6种可组合的运行时模式——从分层委派到人机协作——根据三个架构关切进行选择:协调、状态与控制。

🛡️ 安全 (3)

← 前一天 后一天 →