Llama（Meta）

Llamaは、Metaのオープンウェイト大規模言語モデル群で、2023年2月にLLaMAとして公開され、その後Llama 2（2023年中盤）、Llama 3（2024年）、Llama 4世代へと続いています。各リリースは複数のサイズで提供されます — 通常7B / 8B、70B、はるかに大きなフラッグシップ — そしてチャットやアシスタント用途向けの指示チューニング版が含まれます。

Llamaを際立たせるのはライセンスです。重みは無料でダウンロードでき、ほとんどの商用利用をカバーするほど寛容な条件です。これにより、コミュニティのファインチューニング、ドメイン適応、ローカル推論、学術研究のデフォルトの出発点となりました。大規模なエコシステム — Hugging Face、Ollama、llama.cpp、vLLM、LM Studio — が主にLlama型モデルを提供・適応するために存在します。

アーキテクチャ的には、Llamaは他の現代LLMと類似したデコーダーのみのトランスフォーマーで、RMSNorm、Rotary Positional Embeddings、Grouped-Query Attention、SwiGLU活性化などの改良を含みます。Llama 4はマルチモダリティとMixture-of-Expertsを導入しました。Mistral、DeepSeek、Qwenとともに、Llamaはオープンウェイトのフロンティアを定義し、今日のAIツールの大部分がハイパースケーラークラウドの外で動作できる理由となっています。

出典

関連項目