2026智能体信心指数：300位专家平均评分64/100

2026智能体信心指数是Microsoft与MIT Technology Review Insights合作开展的调研，对来自12个行业的300位技术专家就101项任务的AI智能体信心进行评估。平均得分64/100；仅30项任务超过70分；59%的专家将「人工监督循环」列为首要顾虑。

什么是智能体信心指数？

Microsoft与MIT Technology Review Insights合作，对来自12个行业和4个全球地区的300位技术专家（AI、数据和云领域）进行了调研。目标：衡量专家对101项工作任务中AI智能体的真实信心。平均得分为64/100。仅有30项任务超过70分——表明信心是选择性的，而非普遍性的。

常规任务主导，复杂任务滞后

智能体信心指数呈现清晰分布：对可预测、重复性任务的信心较高——对需要判断或存在高错误风险的任务较低。报告自动化得分83.5/100，样板代码生成82.5，SSL证书监控81.5，实时数据流监控80.5。相比之下，数据库架构迁移仅有46.5，内存泄漏检测48.5。常规自动化任务比涉及责任或创意推理的任务高出多达37分。Microsoft智能体信心指数将这一差异总结为：「最高分聚集在既可预测又令人疲惫的工作上。」

59%的受访者将「保持人工监督循环」列为首要顾虑——即人类在AI决策过程中作为控制点或审批环节的监督模式。另有53%要求更好的系统可观测性，42%要求文档隐私保护协议。

职业机遇：SRE、QA和数据团队持乐观态度

在SRE运营、质量控制（QA/评估）和数据流水线管理岗位上，超过80%的专家对AI智能体日益普及带来的积极职业机遇持乐观态度。Microsoft智能体信心指数记录了角色转变：专家从重复性任务转向监督和战略职位——大多数人将这一变化视为进步，而非威胁。

常见问题

智能体信心指数排名最高的任务是什么，它们有何共同点？

排名最高的包括报告自动化（83.5/100）、样板代码生成（82.5）和SSL证书监控（81.5）。共同点是常规、可预测、结果明确的任务——与得分明显较低的创意或高风险任务形成对比。

「人工监督循环」是什么，为什么59%的受访者感到担忧？

「人工监督循环」指人类在AI决策过程中保持作为控制点或审批环节的监督模式。专家希望确保智能体不会在高风险任务中未经人工审核自主行动，59%的受访者将此列为采用智能体的首要顾虑。

Microsoft：2026智能体信心指数——300位构建者对AI智能体的平均信心得分64/100

什么是智能体信心指数？

常规任务主导，复杂任务滞后

职业机遇：SRE、QA和数据团队持乐观态度

常见问题

来源

相关新闻