arXiv:2605.06540: AI模型中的创意多样性崩溃

当众多用户将AI用于创意任务时，他们都会获得相似的建议——「创意多样性崩溃」。研究人员引入了带有过度聚集系数Δ和多样性比率ρ的事前协议。三个接受测试的前沿模型在短篇故事、营销口号和替代用途任务中均跌破与人类的齐平阈值。

Nafis Saami Azad和Raiyan Abdul Baten于5月7日在arXiv发表的论文，聚焦于创意多样性崩溃（idea diversity collapse）——从用户群体层面来看，创意AI系统产生趋同建议、相互失去价值的现象。

为什么评估单个输出还不够？

传统的创意AI评估孤立地看待单个输出的质量。但作者强调：「当许多人产生相似创意时，这个创意就失去价值了」。如果数千名用户得到相同的口号或相同的短篇故事结局，个体质量就无关紧要了，因为这个建议在市场上已不再具有差异性。

该框架使用事前协议——在不与人类互动的情况下从模型本身生成样本——并与任务匹配的人类基准样本进行比较。作者从博弈论中借鉴了有限资源的概念，并以冗余成本对采用过程进行建模。

两个关键指标：

在短篇故事、营销口号和替代用途任务（Alternative Uses Task）上测试了三个前沿LLM。所有三个模型在多项聚集度量中均跌破齐平阈值——它们产生的多样性都低于人类。

好消息是：改变生成协议（温度、采样、明确指令）可以显著减少崩溃。这使多样性崩溃成为可测量和可改善的设计目标，而非模型的固定限制。

常见问题

什么是创意多样性崩溃？

创意多样性崩溃（idea diversity collapse）是指AI模型在被众多用户用于创意任务时会生成相似建议的现象——因此当许多人同时产生类似创意时，该创意就会失去价值。

Δ和ρ是什么？

Δ（过度聚集系数）测量模型分布内的过度聚集。ρ（多样性比率）是模型相对于人类基准的多样性比率——ρ ≥ 1意味着无聚集的齐平。

可以防止崩溃吗？

可以。作者表明，生成协议的变体可以通过有针对性的设计来减少崩溃——例如更改温度、采样策略或关于多样性的明确指令。