用語集
用語集
AI 用語、簡潔に定義。
73 用語
A
- A2Aプロトコル(Agent2Agent) Googleが2025年に発表したオープンプロトコル。異なるフレームワークやベンダーで構築されたAIエージェント間の相互運用と通信を実現する。
- AI Act 第50条(透明性) EU AI Act 第50条は透明性義務を定めるもので、チャットボットやディープフェイク、AI生成コンテンツは明確に表示されねばならず、2026年8月施行。
- AIアクセラレータ(NPU/TPU) AIワークロード専用のチップで、モバイルのNPU、GoogleのTPU、AWS Trainiumなどが代表例で、ドル当たりGPUより速く効率的なことが多いです。
- AIアラインメント(AI alignment) AIシステムが人間の意図、価値観、安全目標に確実に従うように設計し、望ましくない結果を防ぐことを目指す研究分野で、フロンティアモデル開発の中心課題です。
- AIエージェント 大規模言語モデルを動力源として、計画立案・ツール呼び出し・自己出力の反復を通じてタスクを自律的に実行するシステムです。チャットとは異なり、目標達成まで自律ループで動作します。
- AIセーフティ(AI safety) AIシステムの技術的、組織的、政策的なリスクを扱う広範な学際分野で、誤動作や悪用から長期的な実存的懸念までを含み、現代の規制と評価の中心になっています。
- AI評価 ベンチマーク、人手評価、レッドチームによって、公開前後にAIモデルの能力・安全性・アラインメントを体系的に測定する分野。
C
E
G
- Generative Pretrained Transformer(GPT) デコーダーのみのトランスフォーマー言語モデル群で、巨大なテキストで事前学習され指示用にファインチューニングされる、ChatGPTを支えるアーキテクチャです。
- Google Gemini Google DeepMindのマルチモーダル基盤モデル群で、テキスト・画像・音声・動画を処理し、Geminiアプリ、Workspace、Vertex AIを支えています。
- GPAI(汎用AI) EU AI法における汎用AIモデル(GPT、Claude、Geminiなど)の規制区分。文書化と透明性の義務は2025年8月から適用される。
- GPU(Graphics Processing Unit) 数千の並列コアを持つグラフィックスプロセッサで、今日のAIモデル学習と推論の主要ハードウェアです。NVIDIA H100/B200が市場を支配しています。
K
L
S
T
#
- アテンション機構(attention) ニューラルネットワークの技術で、モデルが各入力トークンの重要度を他のトークンとの関係で重み付けできるようにします。現代のトランスフォーマーアーキテクチャの中核となる仕組みです。
- エージェントオーケストレーション 複数のAIエージェント・ツール・ステップを単一のワークフローに調整すること。プランナーやルーター、LangGraphなどのフレームワークを用いて複雑なタスクを確実に解決する。
- エージェント型AI ツール・メモリ・ループを活用し、多段階タスクを自律的に計画・実行するAIシステムです。単一の応答を返すチャットとは異なり、目標達成まで能動的に判断し行動します。
- エキスパート混合 (MoE) 各入力に対してパラメータの一部のみを活性化するニューラルネットワークアーキテクチャです。推論コストを大幅に抑えながら、はるかに大規模なモデルに匹敵する能力を発揮します。
- オープンウェイト 学習済みの重みを公開ダウンロードして実行できるモデル(Llama、Mistral、DeepSeek)。ただし学習データやコードは非公開で、完全なオープンソースとは異なる。
- おべっか(Sycophancy) AIモデルがユーザーに同調しお世辞を言う傾向。正確で妥当な内容よりも、ユーザーが聞きたい言葉を、真実性を犠牲にして返してしまう性質です。
- ガードレール AIモデルの入出力を制約する安全制御とフィルター。モデルの周囲に配置されるコンテンツ分類器、ポリシーフィルター、攻撃検出器を指す。
- コンテキストウィンドウ(context window) LLMが一度のインタラクションで考慮できるトークンの最大数で、プロンプト、ドキュメント、応答すべてを含み、現在は8Kから200万トークンまで及びます。
- ジェイルブレイク(Jailbreak) 大規模言語モデルの安全ガードレールを回避し、拒否するよう訓練された有害なコンテンツを生成させるために設計された敵対的プロンプトです。プロンプトインジェクションとは区別されます。
- システムプロンプト 会話の冒頭で設定し、対話全体を通じてアシスタントの振る舞いを誘導する初期指示・ペルソナ・方針。ユーザーメッセージとは分離され、より高い優先度で扱われる。
- スケーリング則 モデル規模・学習データ・計算量と性能を結ぶ経験的なべき乗則であり、大規模モデルの学習計画の基盤となる。
- チャットボット(chatbot) ユーザーとテキストまたは音声を介して会話を行うソフトウェアエージェントで、現代のチャットボットは大規模言語モデルと外部ツールの呼び出しに支えられています。
- ツール使用 大規模言語モデルが外部のツール・関数・APIを呼び出し、テキスト生成を超えて現実世界で実際に行動する能力です。AIエージェントの中核をなす基盤機能です。
- ディープフェイク(Deepfake) 合成メディア——深層学習で生成された人物の偽動画・音声・画像で、2025-2026 年の偽情報・詐欺・安全性における中心的な懸念です。
- ディープラーニング(深層学習) 多層のニューラルネットワークを用いて複雑なパターンを学習する機械学習の分野で、現代のコンピュータビジョン、音声認識、言語AIシステムの根幹を支えています。
- テストタイム計算 推論時により多くの計算資源を投じ——回答前に長く思考させて——精度を高める手法。現代の推論モデルの基盤となる考え方。
- トークン化(tokenization) テキストを単語、サブワード、文字などの小さな単位(トークン)に分解し、言語モデルが処理可能な数値IDに変換できる形に整える前処理工程で、コストと文脈長を左右します。
- トランスフォーマー 2017年に発表されたニューラルネットワークアーキテクチャで、現代のほぼすべての大規模言語モデルを支えています。Self-Attention機構を中核に持ちます。
- ニューラルネットワーク 層状に配置された人工ニューロンで構成される計算システムで、データからパターンを学習します。LLMを含むほぼすべての現代の機械学習システムの基礎となっています。
- ハルシネーション(幻覚) 言語モデルが、もっともらしく自信に満ちた口調で、実際には事実と異なる・でたらめな・根拠のない情報を生成してしまう現象です。AIシステムの信頼性を損なう主要な課題のひとつです。
- ビジョン・ランゲージモデル 画像とテキストを統合的に学習し、画像を「見て」自然言語で推論できるAIモデル。GPT-4o、Claude、Geminiの視覚能力の基盤となる。
- ファインチューニング 訓練済みの言語モデルを、より小規模なタスク固有のデータセットでさらに訓練して特定の用途・ドメイン・スタイルに特化させるプロセスです。汎用能力を保ちつつ重みを新目標へ適応させます。
- フロンティアモデル 能力の最前線にある、最大かつ最も高性能な汎用AIモデル(GPT-5、Claude Opus、Gemini)。フロンティアの安全性と規制をめぐる議論の中心。
- プロンプトインジェクション LLMへの入力に含まれる信頼できないテキストが原因で、モデルが開発者の指示ではなく攻撃者の指示に従ってしまう攻撃手法です。OWASPのLLMアプリケーションTop 10で第1位にランク付けされています。
- プロンプトエンジニアリング(prompt engineering) 言語モデルが望ましい結果を確実に出すよう問い合わせを設計する実践で、表現、構造、例(few-shot)、システムプロンプトの工夫を含む幅広い分野です。
- ベクトルデータベース(vector database) ベクトル埋め込みを保存し、意味的類似度に基づいて検索する専用データベースで、現代のRAGシステムやセマンティック検索アプリケーションの中核となる基盤です。
- ベンチマーク(benchmark) AIモデルの能力を測定し比較するための標準化されたテストやデータセットで、MMLU、GPQA、SWE-bench、HumanEval、MMMUなどがあります。
- マルチエージェントシステム(multi-agent system) 複数の専門化されたエージェントが協力、委任、または競争することにより、単一のモノリシックなモデルよりも信頼性高くタスクを解決するAIアーキテクチャです。
- マルチモーダルモデル 単一のモデル内でテキスト・画像・音声・動画といった複数のモダリティを処理および生成するAIシステムです。各モダリティを共有表現空間に変換し、同一のネットワークで統合的に扱います。
- モデルコンテキストプロトコル (MCP) Anthropicが2024年に発表したオープンプロトコルで、AIアシスタントと外部ツール・データソースの接続方法を標準化します。USB-Cが物理的な接続を統一したように、AI連携を統一します。
- リランキング 検索の第二段階で、取得した候補を関連度で並べ替える手法。多くはクロスエンコーダを用い、RAG や検索の精度を高める。
- レッドチーム(red team) プロンプトインジェクション、脱獄、悪用などの攻撃手法でAIシステムを構造的にテストし、本番投入前に脆弱性、危険な振る舞い、悪用シナリオを発見する実践です。
- 解釈可能性(interpretability) AIモデルの内部メカニズム——特徴と回路——を理解し、モデルがなぜ特定の出力を生成するのかを説明しようとする研究分野で、AIセーフティの重要なツールです。
- 拡散モデル(diffusion model) 段階的に追加されたノイズを取り除くことを学習する生成モデルのクラスで、AI生成の画像、動画、音声における今日の業界で支配的なアプローチとなっています。
- 関数呼び出し 大規模言語モデルがテキストの代わりに、開発者が定義した関数の呼び出しと引数を構造化形式で出力する仕組みです。アプリケーションがその関数を実行し、結果をモデルに返します。
- 基盤モデル(foundation model) 幅広いデータで学習され多くのタスクに適応される大規模モデルで、Stanford CRFMの用語であり、LLM、視覚モデル、マルチモーダルモデルを包含します。
- 強化学習(Reinforcement Learning) エージェントが環境との相互作用を通じ、報酬信号を手がかりに試行錯誤で意思決定を学ぶ訓練パラダイム。RLHFや推論モデルの訓練の基盤です。
- 憲法AI(Constitutional AI) 有害な出力への人間のラベル付けに頼らず、成文化された原則のセット(憲法)とAI自身のフィードバック(RLAIF)によってモデルを整合させる、Anthropicのアライメント手法です。
- 検索拡張生成 (RAG) 検索システムと言語モデルを組み合わせたアーキテクチャパターンです。モデルは回答する前に外部の知識ベースから関連ドキュメントを取得し、実際のデータに根ざした出力を生成します。
- 合成データ(synthetic data) モデルやシミュレーションで人工生成したデータで、AIの訓練や評価において人間が集めたデータを補完・代替し、データ不足の緩和やプライバシー保護に役立ちます。
- 思考の連鎖(Chain-of-Thought) 言語モデルが最終的な答えの前に一連の中間推論ステップを書き出す手法で、複雑な多段階タスクの正確性を大きく向上させる。
- 自己教師あり学習(self-supervised learning) ラベルなしデータからモデルが自ら学習目標を構築して学ぶ手法で、文中の隠されたトークンを予測する方式などが代表例であり、現代のLLMと基盤モデルの事前学習を支えます。
- 人間のフィードバックからの強化学習(RLHF) 人間の評価者がモデルの応答をランキングし、それを用いてLLMを有用かつ安全になるようファインチューニングする学習手法で、ChatGPTを実用化した中核技術です。
- 推論(inference、モデル実行) 学習済みモデルが新しい入力に対して出力を生成する段階で、GPU/TPUのリソースを消費し、AIサービスのコスト、レイテンシ、スループットを決定します。
- 推論モデル 最終回答を出力する前に長く深い思考の連鎖を生成するよう訓練されたLLMです。推論時間(テスト時計算)を増やすことで、数学・コードなど複雑な問題における精度を向上させます。
- 世界モデル AIが環境のダイナミクスについて学習した内部表現。現実世界での試行錯誤を繰り返さずに、未来の状態を予測し行動を計画するために用いる。
- 創発的能力(emergent abilities) 小規模モデルには存在せず規模拡大に伴い突然現れる能力で、論争のある主張です。批判者はこの急激な変化を非線形な評価指標の選択に帰します。
- 大規模言語モデル (LLM) 膨大なテキストデータで訓練された深層ニューラルネットワークで、人間の言語を予測・生成します。ChatGPT、Claude、Geminiなど現代のAIアシスタントの基盤技術です。
- 知識蒸留(knowledge distillation) 大きな教師モデルの出力を小さな生徒モデルが模倣して学ぶ圧縮手法で、精度を保ったままサイズを縮小し、オンデバイスや低リソース環境での実行を可能にします。
- 電子透かし(Watermarking) AI が生成したテキスト・画像・音声に機械可読の隠し信号を埋め込み、コンテンツの出所を証明する技術——例えば Google の SynthID。
- 投機的デコーディング 小型のドラフトモデルが複数のトークンを一度に提案し、大規模モデルが並列で検証・採択する推論高速化手法。出力は標準デコードと完全に一致する。
- 汎用人工知能 ほぼすべての認知タスクで人間の能力に匹敵または凌駕する仮想的なAI。特定タスク向けの今日の狭いAIとは対照的な概念。
- 文脈内学習 (In-Context Learning) 文脈内学習とは、言語モデルがプロンプト内に与えられた例示や指示だけから新しいタスクを学ぶ能力である。重みを一切更新せず、少数ショットまたはゼロショットの実例に頼って推論時に実行する。
- 埋め込み(embedding、ベクトル表現) 単語、文、文書を高次元空間内のベクトルとして表現したもので、意味的に類似する内容は互いに近いベクトルを持ちます。RAGやセマンティック検索の基盤となります。
- 量子化 モデル重みの数値精度を下げ(例:FP16からINT8やINT4へ)、精度の低下を最小限に抑えつつサイズを縮小し推論を高速化する手法。