🤝 智能体

54 条新闻

🟡 🤝 智能体 2026年4月27日 · 3 分钟阅读

arXiv:2604.22748:42位作者的综述引入「层级×定律」分类框架——整合逾400篇论文,构建AI智能体世界模型分类体系

抽象的指南针羽毛笔追踪世界模型的层级,横跨智能体系统中的物理、数字、社会与科学领域。

由42位作者共同撰写的综述论文《Agentic World Modeling: Foundations, Capabilities, Laws, and Beyond》,以二维分类框架组织这一研究领域——三个模型能力层级(预测器、模拟器、演化器)与四个定律领域(物理、数字、社会、科学)。综述覆盖逾400篇参考文献及100余个代表性系统。

🟡 🤝 智能体 2026年4月27日 · 2 分钟阅读

arXiv:2604.22452:超级思维测试揭示——200万AI智能体构成的社会中,集体智能并不会自然涌现

抽象的指南针羽毛笔追踪大型数字社区中众多AI智能体之间稀疏而浅层的连接。

墨尔本大学与马里兰大学的研究人员提出了超级思维测试(Superminds Test)——一个用于探测智能体社会集体智能的层级化框架。在拥有逾200万智能体的MoltBook平台上进行的研究表明,该社会的表现未能超越单个前沿模型,且交互极为稀疏与浅层。

🟢 🤝 智能体 2026年4月27日 · 2 分钟阅读

arXiv:2604.21910:智能体AI以83%准确率自动化科学工作流,数据传输减少92%,每次查询费用$0.001

ArXiv 2604.21910:智能体AI以83%准确率自动化科学工作流,数据传输减少92%,每次查询费用$0.001

克拉科夫AGH大学的Bartosz Balis及其团队于2026年4月23日发表论文,将自然语言研究查询转化为可执行的科学工作流。三层架构(语义LLM层、确定性生成器、专家Skills)在Kubernetes上的1000 Genomes工作流中进行了测试——Skills将意图准确率从44%提升至83%,数据传输减少92%,每次查询成本低于$0.001。

🟡 🤝 智能体 2026年4月25日 · 2 分钟阅读

arXiv:2604.21816:「Tool Attention Is All You Need」消除MCP Tax——智能体工作流每轮减少95%的token消耗

编辑插图:Tool Attention MCP Tax——智能体工作流优化

研究人员Anuj Sadani和Deepak Kumar于2026年4月23日在ArXiv上发表论文,解决了所谓的MCP Tax问题——贪婪模式的schema注入每轮消耗1至6万个token。他们的Tool Attention方法将消耗减少95%,上下文利用率从24%提升至91%。

🟢 🤝 智能体 2026年4月25日 · 2 分钟阅读

AWS与Visier通过Amazon Q和MCP集成展示企业级人力资源AI智能体

编辑插图:AWS Visier Amazon Q——劳动力HR AI智能体

AWS与Visier展示了通过Amazon Q和模型上下文协议集成的人力资源AI智能体。Visier将HR分析作为MCP服务器公开,Amazon Q智能体利用这些工具进行人员编制预算、任职期限跟踪和阈值警报——全部通过一个对话界面完成。

🟡 🤝 智能体 2026年4月24日 · 2 分钟阅读

Anthropic:Managed Agents的记忆功能进入公开测试版——AI智能体可在会话间记住上下文

编辑插图:AI智能体 — agenti

Anthropic已将Claude Managed Agents的记忆功能推送至公开测试版。智能体现在可以在会话间保存用户偏好、项目规范和上下文信息。测试版限制包括每个组织最多1000个存储库,每个存储库最多100 MB。

🟢 🤝 智能体 2026年4月24日 · 2 分钟阅读

GitHub:云端智能体会话现可直接从issues和项目视图进行管理

编辑插图:AI智能体 — agenti

GitHub推出了直接从issues和项目视图追踪和管理云端智能体会话的功能。会话徽章、带进度日志的侧边面板以及项目视图中自动激活的会话,标志着自主AI智能体与开发流程的深度融合。

🔴 🤝 智能体 2026年4月23日 · 2 分钟阅读

Google DeepMind与五大顶级咨询公司签署企业AI联盟

编辑插图:AI智能体——agenti

Google DeepMind与全球五大咨询公司——埃森哲、贝恩、BCG、德勤和麦肯锡——签署了合作协议,以加速企业AI转型,因为目前只有25%的组织能够将AI成功部署到生产环境。

🔴 🤝 智能体 2026年4月23日 · 2 分钟阅读

OpenAI在ChatGPT中推出Workspace Agents:面向企业团队的Codex驱动智能体

编辑插图:AI智能体 — agenti

OpenAI发布了Workspace Agents,即直接集成在ChatGPT界面中的Codex驱动AI智能体。智能体在云端运行,自动化复杂工作流程,并帮助企业团队通过跨应用安全机制的连接工具扩展工作。

🟡 🤝 智能体 2026年4月23日 · 2 分钟阅读

AWS发布通过Bedrock、Neptune和Mem0实现企业级AI智能体记忆的架构

编辑插图:AI智能体——agenti

AWS发布了一套架构,将Amazon Bedrock、Neptune图数据库和Mem0框架相结合,为AI智能体提供企业级持久记忆,解决了会话之间和用户之间上下文丢失的问题。

🟡 🤝 智能体 2026年4月23日 · 2 分钟阅读

Amazon Bedrock AgentCore推出托管运行框架:仅需三个API调用即可部署可用智能体

编辑插图:AI智能体 — agenti

Amazon宣布为Bedrock AgentCore推出托管智能体运行框架,仅需三个API调用即可部署完整可用的智能体,无需编写编排基础设施代码。该框架还附带用于完整开发周期的AgentCore CLI,以及面向编程助手的预构建技能,目前在四个AWS区域以预览版提供。

🟢 🤝 智能体 2026年4月23日 · 2 分钟阅读

ArXiv SWE-chat——开发者与生产环境AI编程智能体真实交互数据集

编辑插图:AI智能体——agenti

ArXiv上发布了SWE-chat,这是一个记录用户与AI编程智能体在生产环境中真实「野外」交互的数据集。与基于GitHub Issue的合成基准测试不同,该数据集记录了开发者在日常工作中实际使用自主系统的方式——他们请求什么、如何回应智能体的建议、以及智能体在哪里失败——为更精准的评估和有针对性的智能体设计改进开辟了道路。

🟢 🤝 智能体 2026年4月23日 · 2 分钟阅读

OSWorld研究:AI电脑操控智能体在重复任务时频繁失败

编辑插图:AI智能体 — agenti

一项新研究表明,曾成功执行任务的AI电脑操控智能体在相同任务的重复尝试中可能失败,三个关键原因分别是执行随机性、任务规范模糊性和智能体自身行为的可变性。

🔴 🤝 智能体 2026年4月22日 · 3 分钟阅读

Google ReasoningBank:智能体从经验中学习无需重新训练,WebArena成功率提升8.3%

编辑插图:迷宫中的机器人,发光节点代表所学经验

Google推出ReasoningBank,一个让AI智能体从自身成功与失败中学习的记忆框架,无需重新训练语言模型。在WebArena基准测试中成功率提升8.3%,在SWE-Bench-Verified中提升4.6%,且每个任务减少约3个步骤。

🔴 🤝 智能体 2026年4月22日 · 2 分钟阅读

OpenAI将Codex扩展至企业:Codex Labs计划与400万周活跃用户

编辑插图:未来主义城市景观,AI实体与企业摩天大楼及代码屏幕

OpenAI推出Codex Labs计划,并与Accenture、Deloitte和KPMG建立战略合作,将Codex智能体引入全球大型企业。该工具已达400万周活跃用户,提供顾问认证和按消费计费的企业套餐。

🟡 🤝 智能体 2026年4月22日 · 2 分钟阅读

Agent-World:中国人民大学发布AI智能体进化的可扩展环境合成框架

编辑插图:为AI智能体学习自动生成包含风景和城市的动态环境

Agent-World是中国人民大学发布的全新研究框架,可自动生成数千种多样化环境用于AI智能体训练。该框架取代了手工制作的基准测试,通过动态场景和智能体与环境的协同进化实现演化式学习。

🟡 🤝 智能体 2026年4月22日 · 2 分钟阅读

Gemini Deep Research获得MCP集成、协作规划和两个新版本

编辑插图:带有模块化服务器和数据流的机器人轮廓,用于Deep Research智能体

Google在Gemini API中推出了两个新版Deep Research智能体——deep-research-preview-04-2026和deep-research-max-preview-04-2026——具备MCP服务器集成、协作规划、可视化和流式响应。此举将Gemini定位为ChatGPT Deep Research和Perplexity Deep Research的有力竞争者。

🟡 🤝 智能体 2026年4月22日 · 2 分钟阅读

多智能体系统综述:从经典范式到大型基础模型赋能的未来

编辑插图:通信中的互联AI智能体搭建经典范式与现代LLM时代的桥梁

arXiv发布的新综述全面衔接了经典多智能体系统文献与现代LLM智能体技术栈。该论文识别出协调机制、通信协议和涌现行为方面的范式转变——从低级状态交换演进为语义推理。

🟡 🤝 智能体 2026年4月21日 · 3 分钟阅读

AWS整合Bedrock AgentCore、MCP与Nova 2 Sonic,打造全渠道订单系统——首个企业智能体实战展示

插图:AWS整合Bedrock AgentCore、MCP与Nova 2 Sonic,打造全渠道订单系统——首个企业智能体实战展示

AWS发布了架构示例,展示如何将Bedrock AgentCore Runtime、MCP协议与语音模型Nova 2 Sonic结合,构建全渠道订单系统。这是AWS新智能体服务的首次公开集成,也是面向生产智能体的microVM隔离方案演示。

🟡 🤝 智能体 2026年4月21日 · 2 分钟阅读

新研究警告:LLM智能体可通过提示优化形成稳定价格卡特尔

插图:新研究警告LLM智能体可通过提示优化形成稳定价格卡特尔

ArXiv最新论文表明,多个LLM智能体可以通过提示元优化自发形成稳定的算法共谋,在无需明确协议的情况下实现超竞争价格。这一发现对反垄断法和多智能体系统监管提出了严峻问题。

🟡 🤝 智能体 2026年4月21日 · 3 分钟阅读

NVIDIA OpenShell、Adobe代理和WPP:自主AI代理在数分钟内创建营销内容

Editorialna ilustracija: NVIDIA OpenShell, Adobe Agenti i WPP: autonomni AI agenti kreiraju marketing sadržaj u minutama

NVIDIA扩大了与Adobe和全球最大营销机构WPP的战略合作,以在企业营销中推出自主AI代理。核心是全新的NVIDIA OpenShell——一个基于策略的隔离安全运行时环境——结合Nemotron模型和Adobe Firefly Foundry视觉内容生成器。

🟢 🤝 智能体 2026年4月21日 · 2 分钟阅读

AWS ToolSimulator:LLM驱动的AI代理测试框架,无需实际API调用,跨多轮对话维护共享状态

Editorialna ilustracija: AWS ToolSimulator: LLM-pogonjeno testiranje AI agenata bez živih API poziva — shared state kroz

AWS推出了ToolSimulator,这是Strands Evals平台内一个LLM驱动的框架,用于在不进行实际API调用的情况下安全测试AI代理。模拟器在多轮对话中维护一致的共享状态,并生成上下文适当的响应,允许测试发送邮件或修改数据库的代理,而不产生实际后果。

🟢 🤝 智能体 2026年4月21日 · 2 分钟阅读

NVIDIA发布Nemotron-Personas-Korea:700万条韩国AI智能体合成人格数据集

插图:NVIDIA发布Nemotron-Personas-Korea——700万条韩国AI智能体合成人格数据集

NVIDIA联合合作伙伴发布了开源数据集Nemotron-Personas-Korea,包含700万条基于韩国官方人口统计数据的合成人格。目标是在不涉及隐私风险的前提下,支持具有文化感知能力的AI智能体开发。

🟡 🤝 智能体 2026年4月20日 · 2 分钟阅读

Experience Compression Spectrum:将记忆、技能和规则统一于LLM智能体的架构框架

编辑插图:LLM智能体中从原始情节到压缩规则的经验压缩级别连续体

Experience Compression Spectrum是一个新的架构框架,将LLM智能体的记忆、技能和规则置于单一压缩递增轴上——从情节记忆(5-20×)到程序技能(50-500×)再到声明式规则(1000×+)。分析揭示,现有系统在固定压缩级别运行,且记忆与技能之间缺乏相互通信。

🟡 🤝 智能体 2026年4月20日 · 2 分钟阅读

WORC:强化多智能体系统中最弱智能体在推理基准上达到82.2%准确率

编辑插图:AI智能体链中最薄弱的环节被额外计算资源所强化

WORC(Weak-Link Optimization for Reasoning and Collaboration)是一个新框架,它不优化强智能体,而是识别并强化多智能体LLM系统中的薄弱环节。通过元学习和群体智能找到表现不佳者,然后为其分配额外推理资源。结果:推理基准平均准确率82.2%,跨架构稳定性更高。

🟡 🤝 智能体 2026年4月19日 · 2 分钟阅读

Autogenesis:支持版本化资源与回滚机制的AI代理自演化新协议

编辑插图:带有反馈回路和版本化流的模块化组件系统

Autogenesis(AGP)是一种将AI代理、提示词、工具和记忆建模为带有显式状态和版本化接口的注册资源的协议。自演化协议层(SEPL)提供闭环操作接口,用于提议、评估和提交改进,并带有审计跟踪和回滚功能,从而解决了迭代修改自身组件的代理的不稳定性问题。

🟡 🤝 智能体 2026年4月19日 · 2 分钟阅读

RadAgent:逐步解读胸部CT影像的AI工具,宏观F1得分相对提升36%

编辑插图:AI代理分析胸部CT影像,医疗场景,无人脸

RadAgent是一款用于胸部CT影像解读的AI代理,通过透明的逐步流程,在宏观F1得分上相对超越基线CT-Chat模型36.4%,微观F1提升19.6%,对抗鲁棒性提升41.9%。该工具可生成带有决策检查轨迹的放射科报告,Faithfulness得分达37%,而基线为0%。

🟢 🤝 智能体 2026年4月19日 · 2 分钟阅读

CoopEval:更强的推理模型在社会困境中系统性地更不合作——多智能体 AI 的反直觉发现

编辑插图:两个抽象智能体处于社会困境中,博弈论元素

CoopEval 是一个新基准,用于测试大语言模型 (LLM) 智能体在囚徒困境和公共物品博弈等经典社会困境中的表现。反直觉发现:更强的推理模型比较弱的模型更频繁地背叛,在单次混合动机情境中系统性地破坏合作。对于需要在自身利益与集体利益之间平衡的多智能体 AI 部署具有重要意义。

🟢 🤝 智能体 2026年4月19日 · 2 分钟阅读

Mind DeepResearch:三智能体框架用 30B 参数模型在深度研究任务上实现顶级结果

编辑插图:三个抽象智能体在研究过程中协作,网络结构

Mind DeepResearch(MindDR)是一个新的多智能体深度研究框架,使用约 300 亿参数的模型(Qwen2.5 或 DeepSeek 级别,而非 GPT-4 或 Claude Opus 规模)实现具有竞争力的结果。架构包括:规划智能体 + 深度搜索智能体 + 报告智能体,以及含数据合成的四阶段训练流水线,已于 2026 年 4 月 17 日发布技术报告。

🟡 🤝 智能体 2026年4月18日 · 2 分钟阅读

LangChain 与 Cisco 展示 Agentic Engineering:Bug 发现时间缩短 93%,开发效率提升 65%

编辑插图:软件开发中协调运作的 AI 智能体群,网络抽象可视化

Agentic Engineering 是一种让 AI 智能体群接管整个软件生命周期(而不仅仅是编写代码)的方法。LangChain 与 Cisco 工程师 Renuka Kumar 和 Prashanth Ramagopal 于 2026 年 4 月 17 日发布了包含 Leader 和 Worker 智能体的参考架构。在 Cisco 的试点项目中,共有 70 名用户、512 个会话参与,Bug 根因发现时间缩短了 93%,开发工作流执行时间缩短了 65%。

🟢 🤝 智能体 2026年4月18日 · 2 分钟阅读

HuggingFace 发布 Ecom-RLVE-Gym:8 个环境和 12 轴课程,用于强化学习训练电商智能体

编辑插图:电商训练的抽象环境,包含商品网络和学习路径

Owlgebra AI 团队于 2026 年 4 月 16 日在 HuggingFace 博客发布了 Ecom-RLVE-Gym 项目——一个包含 8 个可验证电商对话智能体训练环境的开放框架,使用算法奖励而非 LLM 评判。系统采用包含 200 万商品的目录、Qwen 3 8B 模型和 12 轴自适应课程,逐步提高任务难度,以应对监督微调在复杂多步骤流程中的局限性。

🔴 🤝 智能体 2026年4月17日 · 1 分钟阅读

OpenAI:Codex(几乎)无所不能——集成电脑使用、浏览和插件的桌面应用

OpenAI Codex是面向macOS和Windows的更新版桌面应用,现已集成电脑使用、应用内浏览、图像生成、持久记忆和插件系统。与Anthropic的Opus 4.7同日发布,Codex代表着打造集完整智能体能力于一体的全能AI编程助手的最雄心勃勃的尝试。

🟡 🤝 智能体 2026年4月17日 · 1 分钟阅读

GitHub CLI:新命令gh skill支持跨平台AI代理技能管理

GitHub CLI 2.90.0版本引入了gh skill命令,支持发现、安装、管理和发布面向GitHub Copilot、Claude Code、Cursor、Codex、Gemini CLI和Antigravity的AI代理技能。通过不可变发布、SHA内容验证和版本固定来保障供应链安全。

🟢 🤝 智能体 2026年4月17日 · 2 分钟阅读

ArXiv OpenMobile:具有轨迹合成和策略切换的开源移动智能体

OpenMobile是基于视觉语言模型的移动智能体开发新型开源框架。微调Qwen2.5-VL后在AndroidWorld基准测试上达到51.7%的成功率,Qwen3-VL更达到64.7%——显著高于现有开放数据方法,接近达到近70%的闭源系统。作者将所有数据和代码公开发布。

🟢 🤝 智能体 2026年4月17日 · 1 分钟阅读

LangChain:异步子代理带来数百个并行AI代理的fire-and-steer范式

LangChain发布了新的异步子代理模型,允许监督代理在不阻塞的情况下启动数百个并行子代理实例。fire-and-steer范式允许通过start_async_task、check_async_task和update_async_task工具在运行时修改子代理的指令,可在LangSmith平台或自托管基础设施上运行。

🟡 🤝 智能体 2026年4月16日 · 2 分钟阅读

OpenAI:新一代Agents SDK引入原生沙箱执行,打造更可靠的智能体

OpenAI发布了Agents SDK的重大升级,引入原生沙箱执行(native sandbox execution)和模型原生框架(model-native harness),用于构建更可靠的长期运行AI智能体。新版本专注于代码执行安全性和智能体自主性,使开发团队能够构建可在无人监督的情况下运行数小时且保持可靠性的智能体。

🟢 🤝 智能体 2026年4月16日 · 1 分钟阅读

ArXiv:TREX——两个AI智能体自动化语言模型微调的完整流程

TREX是一个新的多智能体系统,可自动化大型语言模型微调的完整流程——从需求分析和文献检索到数据准备和结果评估。该系统将实验过程建模为搜索树,在包含10个真实任务的FT-Bench基准测试上始终能优化模型性能。

🟢 🤝 智能体 2026年4月16日 · 1 分钟阅读

IBM Research:VAKRA基准测试揭示AI代理在复杂推理上的失败

IBM Research发布了VAKRA——一个用于在企业环境中评估AI代理的新基准,包含超过8,000个本地API、62个领域和4,187个测试实例。关键发现是模型在简单任务上表现出表面能力,但在组合推理上失败,多跳推理随深度降级,遵守外部约束导致性能显著下降。

🔴 🤝 智能体 2026年4月15日 · 1 分钟阅读

ArXiv:禁止规则有效,正面指导反而有害——关于AI编程代理规则的实证研究

对GitHub上679个规则文件和25,532条规则的分析表明,禁止性规则能改善AI编程代理的表现,但正面指导实际上会产生负面影响。随机生成的规则与专家编写的规则效果相当。

🟡 🤝 智能体 2026年4月15日 · 1 分钟阅读

ArXiv: HORIZON — AI智能体在长期任务中何处以及为何失败

新基准测试HORIZON系统性分析了LLM智能体在长期任务中的失败模式。研究发现错误会在多个步骤中累积,即使最优秀的模型在执行20步以上的动作后也会失去焦点。

🟡 🤝 智能体 2026年4月15日 · 1 分钟阅读

ArXiv:PAC-BENCH — 当AI代理必须在协作中保守秘密时会发生什么?

首个评估多AI代理在隐私约束下协作的基准测试。结果表明隐私会显著降低协作质量,并导致三类错误,包括由隐私引起的幻觉。

🟢 🤝 智能体 2026年4月15日 · 1 分钟阅读

ArXiv:SWE-AGILE — 小模型如何解决编程代理的上下文爆炸问题

SWE-AGILE引入了动态上下文策略,结合滑动窗口和压缩摘要用于AI编程代理。仅使用7-8B参数的模型就在SWE-Bench-Verified上达到了新的最优水平,仅用2,200个训练样本。

🔴 🤝 智能体 2026年4月14日 · 1 分钟阅读

OpenAI与Cloudflare:GPT-5.4和Codex驱动面向企业的全新Agent Cloud平台

Cloudflare将OpenAI的GPT-5.4和Codex模型集成到其全新Agent Cloud平台中,使企业用户能够构建、部署和扩展用于实际业务任务的AI智能体,重点关注速度和安全性。

🟡 🤝 智能体 2026年4月14日 · 1 分钟阅读

AI2:AI智能体能解决80%的教科书科学题,但只能完成20%的真实科学问题

Allen AI研究所分析了两个基准测试,揭示了AI在知识测试中的表现与真实科学发现能力之间的巨大差距。模型在教科书层面达到80%,但在复杂科学任务中降至20%。

🟡 🤝 智能体 2026年4月14日 · 1 分钟阅读

ArXiv HiL-Bench:AI智能体知道何时该向人类求助吗?

新基准测试HiL-Bench衡量AI智能体识别自身局限并请求人类帮助(而非盲目猜测)的能力。结果显示,即使是前沿模型也难以判断何时需要帮助,但有针对性的训练可以改善这一能力。

🔴 🤝 智能体 2026年4月13日 · 2 分钟阅读

ArXiv HiL-Bench:没有任何前沿模型知道何时该请求帮助

新基准测试揭示了AI代理在判断力方面的普遍缺陷——当规格不完整时,没有任何前沿模型能达到其完整性能的一小部分以上。研究人员表明,这种能力可以通过强化学习来训练。

🟢 🤝 智能体 2026年4月13日 · 1 分钟阅读

ArXiv SAGE:27个LLM测试——模型理解意图但无法正确执行

面向客户服务的新基准测试揭示了两个现象:'执行差距'(模型能正确分类意图但不执行正确操作)和'共情韧性'(模型在犯逻辑错误的同时保持礼貌)。

🟡 🤝 智能体 2026年4月12日 · 1 分钟阅读

GitHub Copilot CLI:初学者官方指南——从终端将任务委托给云代理

GitHub 于 4 月 10 日发布了 Copilot CLI 工具的官方教程。该指南涵盖了通过 npm 进行安装、使用 GitHub 账户进行身份验证以及实用示例——包括将任务委托给云代理。

🟡 🤝 智能体 2026年4月11日 · 1 分钟阅读

Anthropic 发布政策框架《Trustworthy agents in practice》

Anthropic 发布了全面的政策框架《Trustworthy agents in practice》,该框架定义了以可信赖的方式开发、部署和使用 AI 代理的含义。该文档作为构建或使用代理的公司的指南。

🟡 🤝 智能体 2026年4月11日 · 2 分钟阅读

ArXiv PASK:具有长期记忆的主动式 AI 代理,可预测用户意图

新论文 PASK 提出了一个主动式 AI 代理框架,结合了意图检测、混合记忆和自发行动。IntentFlow 模型在识别潜在用户需求方面达到了领先的 Gemini 3 Flash 模型的水平。

🟡 🤝 智能体 2026年4月11日 · 2 分钟阅读

ArXiv SAVeR:LLM 代理的自我审计 — 执行前先验证(ACL 2026)

新方法 SAVeR(Self-Audited Verified Reasoning)被 ACL 2026 接收,它允许 LLM 代理在执行动作之前进行自我修正。目标:防止违反逻辑约束的连贯推理导致错误决策。

🟢 🤝 智能体 2026年4月11日 · 1 分钟阅读

ArXiv KnowU-Bench:用于交互式和主动式移动 AI 代理的新基准

研究人员推出了 KnowU-Bench —— 一个全面的基准,用于评估新一代移动 AI 代理,重点关注通过长期使用实现的交互性、主动性和个性化。

🟡 🤝 智能体 2026年4月10日 · 2 分钟阅读

AWS Agent Registry:企业级AI智能体目录进入预览阶段

Amazon发布了AWS Agent Registry的预览版——面向企业组织的AI智能体、工具和智能体技能的集中式目录。该系统可索引智能体(无论托管在何处:AWS、其他云或本地),并使用关键字与语义搜索的组合,配合基于IAM的访问控制。

🟡 🤝 智能体 2026年4月10日 · 2 分钟阅读

AWS Bedrock AgentCore:有状态MCP客户端支持交互式AI工作流

Amazon为Bedrock AgentCore Runtime扩展了三项新的MCP能力——elicitation(向用户请求结构化输入)、sampling(向客户端请求LLM补全)和进度通知。有状态会话现在最长可持续8小时(运行于隔离的microvM中),并支持智能体与客户端之间的双向通信。