Google Gemini

Google Geminiは、Google DeepMindが構築するマルチモーダル基盤モデル群で、2023年12月にPaLMおよびLaMDAの後継として発表されました。Geminiは最初からネイティブにマルチモーダルとなるよう設計されています。テキスト、画像、音声、動画、コードを単一の大規模言語モデル内で処理し、テキストモデルにモダリティを後付けで「貼り付ける」のではありません。

ラインアップは複数の階層をカバーします。Gemini Nanoはデバイス上で動作し、Flashは高スループットのクラウド推論を狙い、Proは日常の主力、Ultra/AdvancedはGPTやClaudeと並びフロンティアに立っています。後続バージョン — Gemini 1.5、2.0、2.5 — はコンテキストを100万トークン以上に拡張し、ネイティブツール利用を追加し、ブラウザやコードベースを操作できるAIエージェントへと成熟しました。

Geminiは、同名の消費者向けアプリ、Google Workspace（Docs、Gmail、Sheets、Meet）のAI機能、Androidアシスタント、開発者向けVertex AIプラットフォームを駆動します。GoogleはまたGemmaも提供しています — Geminiとアーキテクチャ的アイデアを共有しつつ、オープンソースコミュニティ向けのオープンウェイト派生モデルです。

出典

関連項目