Llama (Meta)

Llama는 Meta의 오픈 가중치 대규모 언어 모델 (LLM) 계열로, 2023년 2월 LLaMA로 출시되었으며 이후 Llama 2(2023년 중반), Llama 3(2024), Llama 4 세대로 이어졌습니다. 각 릴리스는 여러 크기로 제공됩니다 — 일반적으로 7B / 8B, 70B, 그리고 훨씬 더 큰 플래그십 — 그리고 채팅 및 어시스턴트 사용 사례를 위한 지시 튜닝 변종이 함께 제공됩니다.

Llama를 차별화하는 것은 라이선스입니다. 가중치를 무료로 다운로드할 수 있으며, 대부분의 상업적 사용을 포괄할 만큼 충분히 관대한 조건이 적용됩니다. 이로 인해 Llama는 커뮤니티의 파인튜닝, 도메인 적응, 로컬 추론, 학술 연구의 기본 출발점이 되었습니다. 거대한 생태계 — Hugging Face, Ollama, llama.cpp, vLLM, LM Studio — 가 주로 Llama 유형 모델을 서빙하고 적응시키기 위해 존재합니다.

아키텍처적으로 Llama는 다른 현대 LLM과 유사한 디코더 전용 트랜스포머이며, RMSNorm, 회전 위치 임베딩(Rotary Positional Embeddings), Grouped-Query Attention, SwiGLU 활성화 함수 같은 개선을 포함합니다. Llama 4는 멀티모달리티와 Mixture-of-Experts를 도입했습니다. Mistral, DeepSeek, Qwen과 함께 Llama는 오픈 가중치 프론티어를 정의하며, 오늘날 AI 도구의 상당 부분이 하이퍼스케일러 클라우드 외부에서 동작할 수 있는 이유입니다.

출처

관련 항목