Modeli
Llama (Meta)
Obitelj velikih jezičnih modela otvorenih težina koju je objavila Meta, široko korištena za fino podešavanje i lokalnu primjenu u open-source zajednici.
Llama je Metina obitelj velikih jezičnih modela otvorenih težina, lansirana kao LLaMA u veljači 2023., a nastavljena kroz Llamu 2 (sredina 2023.), Llamu 3 (2024.) i generaciju Llama 4. Svaki release dolazi u više veličina — tipično 7B / 8B, 70B i znatno veći flagship — uz instrukcijski podešene varijante namijenjene chatu i asistentskim slučajevima upotrebe.
Llamu izdvaja licenca: težine se mogu besplatno preuzeti, s uvjetima dovoljno permisivnima da pokriju većinu komercijalne upotrebe. To ju je učinilo zadanom polaznom točkom za zajedničko fino podešavanje, domensku adaptaciju, lokalni inference i akademska istraživanja. Velik ekosustav — Hugging Face, Ollama, llama.cpp, vLLM, LM Studio — postoji prvenstveno da posluži i prilagodi modele Llama tipa.
Arhitektonski, Llama je samo-dekoderski transformer sličan ostalim suvremenim LLM-ovima, s rafinmanima poput RMSNorma, rotacijskih pozicijskih embeddinga, grouped-query attentiona i SwiGLU aktivacija. Llama 4 uvela je multimodalnost i mixture-of-experts. Zajedno s Mistralom, DeepSeekom i Qwenom, Llama definira open-weight frontir i razlog je zašto velik dio današnjeg AI alata može raditi izvan hyperscaler clouda.