Modeli
Google Gemini
Obitelj multimodalnih temeljnih modela Google DeepMinda koja obrađuje tekst, slike, audio i video; pogoni Gemini aplikaciju, Workspace i Vertex AI.
Google Gemini je obitelj multimodalnih temeljnih modela koju gradi Google DeepMind, najavljena u prosincu 2023. kao nasljednik ranijih linija PaLM i LaMDA. Gemini je od samog početka dizajniran da bude izvorno multimodalan: obrađuje tekst, slike, audio, video i kod unutar jednog velikog jezičnog modela, umjesto da se modaliteti naknadno “lijepe” na tekstualni model.
Linija obuhvaća više razina: Gemini Nano radi na uređajima, Flash cilja na cloud inference visoke propusnosti, Pro je svakodnevni radni konj, a Ultra/Advanced stoji na frontiru uz GPT i Claudea. Daljnje verzije — Gemini 1.5, 2.0, 2.5 — proširile su kontekst na milijun tokena i više, dodale izvorno korištenje alata i sazrele u AI agente sposobne upravljati preglednicima i kod-bazama.
Gemini pogoni istoimenu potrošačku aplikaciju, AI funkcije u Google Workspaceu (Docs, Gmail, Sheets, Meet), Android asistente i Vertex AI platformu za developere. Google također nudi Gemmu — open-weight derivate koji dijele arhitektonske ideje s Geminijem, ali su namijenjeni open-source zajednici.