Infrastruktura

Temeljni model

Veliki model treniran na širokim podacima koji se prilagođava za mnoge zadatke; pojam Stanford CRFM-a obuhvaća LLM-ove, vizualne i multimodalne modele.

Temeljni model (foundation model) je naziv koji je 2021. uveo Stanfordov Center for Research on Foundation Models (CRFM) za velike modele trenirane samonadziranim učenjem na širokim podacima, koji se zatim prilagođavaju (fino podešavanjem ili promptingom) za niz nizvodnih zadataka.

Definicija je namjerno šira od “velikog jezičnog modela”. Temeljni modeli uključuju:

  • Tekst: GPT-5, Claude, Gemini, Llama
  • Slike: Stable Diffusion, DALL-E, Midjourney
  • Multimodalni: GPT-4o, Claude 3.5 Sonnet, Gemini 2.0 (tekst + slika + audio + video)
  • Kod: Codex, StarCoder, Qwen Coder
  • Roboti i znanstveni: RT-2, AlphaFold, MolecularAI

Pojam je kontroverzan — neki istraživači smatraju da preuveličava generalnost ovih modela. Ipak, ušao je u regulativu: EU AI Act izrijekom regulira “general-purpose AI models” što je u suštini sinonim, s posebnim obvezama za one trenirane s više od 10²⁵ FLOPs (sistemski rizik).

Glavna teza CRFM-a je da temeljni modeli nose istovremeno ogromne mogućnosti (jedna osnova za stotine aplikacija) i sistemske rizike (svaki nedostatak temelja propagira se nizvodno na svaki proizvod sagrađen na njemu). Cijela industrija sigurnosti, evaluacija i red-teaminga nastala je oko upravo te teze.

Izvori

Vidi također