モデル
Google Gemini
Google DeepMindのマルチモーダル基盤モデル群で、テキスト・画像・音声・動画を処理し、Geminiアプリ、Workspace、Vertex AIを支えています。
Google Geminiは、Google DeepMindが構築するマルチモーダル基盤モデル群で、2023年12月にPaLMおよびLaMDAの後継として発表されました。Geminiは最初からネイティブにマルチモーダルとなるよう設計されています。テキスト、画像、音声、動画、コードを単一の大規模言語モデル内で処理し、テキストモデルにモダリティを後付けで「貼り付ける」のではありません。
ラインアップは複数の階層をカバーします。Gemini Nanoはデバイス上で動作し、Flashは高スループットのクラウド推論を狙い、Proは日常の主力、Ultra/AdvancedはGPTやClaudeと並びフロンティアに立っています。後続バージョン — Gemini 1.5、2.0、2.5 — はコンテキストを100万トークン以上に拡張し、ネイティブツール利用を追加し、ブラウザやコードベースを操作できるAIエージェントへと成熟しました。
Geminiは、同名の消費者向けアプリ、Google Workspace(Docs、Gmail、Sheets、Meet)のAI機能、Androidアシスタント、開発者向けVertex AIプラットフォームを駆動します。GoogleはまたGemmaも提供しています — Geminiとアーキテクチャ的アイデアを共有しつつ、オープンソースコミュニティ向けのオープンウェイト派生モデルです。