レッドチーム（red team）

**レッドチーム（red team）**は、自社のAIシステムを資格のあるテスター集団が意図的に攻撃する実践であり、システムが危険、ミスアラインメント、または望ましくないことをするシナリオを発見することを目的とします — 悪意のある外部行為者や有給ジャーナリストがそれを発見する前に。

この用語は軍事およびサイバーセキュリティから借用されていますが、AIレッドチームには独自の特殊性があります：

大手研究所（OpenAI、Anthropic、Google DeepMind）は今や日常的に「system cards」を作成・公開し、各フロンティアモデルのレッドチーム手順を詳述しています。EU AI ActとUK AISIの評価は、システムリスクを持つGPAIに対してレッドチームを要求します。

レッドチームはAIセーフティとアラインメント技術の補完であり、代替ではありません — レッドチームが見つけないものは、本番でユーザーまたは攻撃者が見つけるでしょう。専門のレッドチーム企業とバグバウンティプログラムの業界全体が2023年以降に生まれました。

出典