모델
Llama (Meta)
Meta가 공개하는 오픈 가중치 대규모 언어 모델(LLM) 계열로, 오픈소스 커뮤니티에서 파인튜닝, 도메인 적응, 로컬 추론을 위해 폭넓게 활용됩니다.
Llama는 Meta의 오픈 가중치 대규모 언어 모델 (LLM) 계열로, 2023년 2월 LLaMA로 출시되었으며 이후 Llama 2(2023년 중반), Llama 3(2024), Llama 4 세대로 이어졌습니다. 각 릴리스는 여러 크기로 제공됩니다 — 일반적으로 7B / 8B, 70B, 그리고 훨씬 더 큰 플래그십 — 그리고 채팅 및 어시스턴트 사용 사례를 위한 지시 튜닝 변종이 함께 제공됩니다.
Llama를 차별화하는 것은 라이선스입니다. 가중치를 무료로 다운로드할 수 있으며, 대부분의 상업적 사용을 포괄할 만큼 충분히 관대한 조건이 적용됩니다. 이로 인해 Llama는 커뮤니티의 파인튜닝, 도메인 적응, 로컬 추론, 학술 연구의 기본 출발점이 되었습니다. 거대한 생태계 — Hugging Face, Ollama, llama.cpp, vLLM, LM Studio — 가 주로 Llama 유형 모델을 서빙하고 적응시키기 위해 존재합니다.
아키텍처적으로 Llama는 다른 현대 LLM과 유사한 디코더 전용 트랜스포머이며, RMSNorm, 회전 위치 임베딩(Rotary Positional Embeddings), Grouped-Query Attention, SwiGLU 활성화 함수 같은 개선을 포함합니다. Llama 4는 멀티모달리티와 Mixture-of-Experts를 도입했습니다. Mistral, DeepSeek, Qwen과 함께 Llama는 오픈 가중치 프론티어를 정의하며, 오늘날 AI 도구의 상당 부분이 하이퍼스케일러 클라우드 외부에서 동작할 수 있는 이유입니다.