LLMの心理プロファイル：81〜90%は測定アーティファクト

arXiv:2606.20205の研究では、56の指示調整済み言語モデルを標準化された心理・嗜好測定ツールでテストしました。分散分解を用いた分析により、方向性のある反応バイアスがモデル間の差異の81〜90%を説明することが判明しました。人間では同割合は9〜16%に過ぎず、著者らはLLMの心理プロファイルは安定した人格ではなく測定アーティファクトであると結論付けています。

論文 arXiv:2606.20205 は、言語モデルの心理プロファイリングという近年広まっている実践——人間向けに設計された人格・嗜好テストを大型言語モデルに適用すること——を再検討します。研究者らは標準化された心理・嗜好測定ツールを使い、56の指示調整済みモデルをテストしました。

発見されたこと

分散分解（変動の源泉を分離する統計的手法）を用いて、著者らは方向性のある反応バイアス——内容に関わらず特定の回答を選ぶモデルの傾向——がモデル間の差異の81〜90%を説明することを明らかにしました。人間ではこの割合はわずか 9〜16% です。この差は、モデルの「人格」のように見えるものが、安定した特性ではなく測定上のアーティファクトから来ていることを意味します。

なぜ重要か

この研究によると、プロファイルは使用する質問によって変わるため、同じテストの結果は信頼できず比較もできません。著者らは人間向け心理尺度をそのまま流用するのではなく、モデル評価専用のツールの開発を求めています。この発見は、特定のモデルが「キャラクター」を持つと主張する見出しへの警告です——そのような主張はしばしば測定アーティファクトに基づいています。

よくある質問

何モデルをテストしましたか？

標準化された心理・嗜好測定ツールを使い、56の指示調整済み言語モデルをテストしました。

反応バイアスの割合はどのくらいですか？

方向性のある反応バイアスがモデル間の分散の81〜90%を説明しており、人間では9〜16%に過ぎません。

著者の推奨事項は何ですか？

プロファイルは使用する質問によって変わるため、モデル評価専用の測定ツールの開発を推奨しています。

arXiv:2606.20205：LLMの心理プロファイルは安定した人格ではなく測定アーティファクトである

発見されたこと

なぜ重要か

よくある質問

出典

関連ニュース