モデル
Llama(Meta)
Metaが公開するオープンウェイトの大規模言語モデル群で、ファインチューニングやローカル運用のためにオープンソースコミュニティで広く利用されています。
Llamaは、Metaのオープンウェイト大規模言語モデル群で、2023年2月にLLaMAとして公開され、その後Llama 2(2023年中盤)、Llama 3(2024年)、Llama 4世代へと続いています。各リリースは複数のサイズで提供されます — 通常7B / 8B、70B、はるかに大きなフラッグシップ — そしてチャットやアシスタント用途向けの指示チューニング版が含まれます。
Llamaを際立たせるのはライセンスです。重みは無料でダウンロードでき、ほとんどの商用利用をカバーするほど寛容な条件です。これにより、コミュニティのファインチューニング、ドメイン適応、ローカル推論、学術研究のデフォルトの出発点となりました。大規模なエコシステム — Hugging Face、Ollama、llama.cpp、vLLM、LM Studio — が主にLlama型モデルを提供・適応するために存在します。
アーキテクチャ的には、Llamaは他の現代LLMと類似したデコーダーのみのトランスフォーマーで、RMSNorm、Rotary Positional Embeddings、Grouped-Query Attention、SwiGLU活性化などの改良を含みます。Llama 4はマルチモダリティとMixture-of-Expertsを導入しました。Mistral、DeepSeek、Qwenとともに、Llamaはオープンウェイトのフロンティアを定義し、今日のAIツールの大部分がハイパースケーラークラウドの外で動作できる理由となっています。