Google Research:Vantage——AIアバターとの対話でクリティカルシンキングと創造性を評価するAIプラットフォーム
なぜ重要か
Google ResearchがNYUと共同でVantageを発表しました。クリティカルシンキングや創造性など測定が困難な人間のスキルを生成AIで評価する実験的プラットフォームです。AI評価は人間の専門家と同等の一致度を示しました。
Google Researchとニューヨーク大学(NYU)が、生成AIを活用して従来ほぼ客観的な測定が不可能だったスキル——クリティカルシンキング、コラボレーション、創造性——を評価する革新的なプラットフォーム、Vantageを開発しました。
Vantageの仕組み
システムは、ディベートの準備やクリエイティブなピッチングなどの協働タスクをシミュレートするAIアバターとの動的な対話に学習者を配置します。2つの主要なAIコンポーネントが評価を推進します:
Executive LLMは、教育的ルーブリックを使用してアバターの応答を誘導し、アイデアへの異議やシミュレートされた対立など、的を絞った課題を導入します——学習者がスキルを発揮する機会を作ります。
AI Evaluatorは、同じルーブリックに基づいて対話のトランスクリプトを分析し、視覚的な評価と具体的な改善アドバイスを含む詳細なフィードバックを生成します。
結果の検証
NYUで実施された188名の参加者(18〜25歳)を対象とした研究では、AI評価は専門家間の相互一致度と同等のレベルで人間の専門家と一致しました。クリエイティブなマルチメディアタスクを用いた別の研究では、AIと人間の評価間のピアソン相関係数は0.88という高い値を示しました。
教育への可能性
Vantageは、カリキュラムに統合された「スキルレイヤー」の可能性を開きます。学生は内容知識と主要なコンピテンシーの発達の両方について二重のフィードバックを受けることができます。これは、AI時代における教育機関の「ソフトスキル」評価のあり方を変革する可能性があります。