为什么汇总指标具有误导性？

52% 的平均值掩盖了同一模型最优与最差类别之间 38 至 40 个百分点的差距。

arXiv LegalHalluLens：法律 AI 幻觉深度分析

LegalHalluLens 论文针对 CUAD 合同数据，从数字型、时间型、义务型和事实型四类幻觉对法律 AI 进行分析。核心发现：52% 的总体幻觉率掩盖了同一模型最优与最差类别之间 38 至 40 个百分点的差距，而这在汇总指标中完全不可见。采用智能体型怀疑者的校准辩论流水线在使用更小模型的情况下，将误报率降低了 45%。

新预印本 LegalHalluLens 表明，法律 AI 的幻觉平均率具有误导性，因为它掩盖了各类错误之间的巨大差异。

按类型进行幻觉分析

LegalHalluLens 引入「类型化幻觉分析」，将幻觉分为四类：数字型、时间型、义务/权利型和事实型。分析基于 CUAD 数据集——一个标准的法律合同语料库。这里的幻觉定义为模型作为事实陈述但无来源支撑的断言。

掩盖差异的平均值

核心发现是：52% 的总体幻觉率掩盖了同一模型最优与最差类别之间 38 至 40 个百分点的差距。换言之，一个模型在某类断言上可能相当可靠，而在另一类上则极不可靠——这在汇总指标中完全不可见。论文还引入了风险方向指数（RDI），这是一个区分遗漏偏差与捏造偏差的标量，用于「方向感知的风险采购」。

如何减少误报？

提出的校准辩论流水线利用智能体型怀疑者对断言发起挑战，从而将误报率降低 45%，同时以规模更小的模型达到商业级水准。该论文在 ICML 2026 的 AIWILD 研讨会上发表，对法律团队具有实际价值——它表明，汇总可靠性指标不足以进行风险评估。

arXiv:2606.18021: LegalHalluLens 揭示法律 AI 52% 幻觉平均值背后隐藏着 38 个百分点的差距

按类型进行幻觉分析

掩盖差异的平均值

如何减少误报？

常见问题

来源

相关新闻