Google: Gemini 3.1 Flash-Lite ulazi u opću dostupnost
Gemini 3.1 Flash-Lite je od 7. svibnja 2026. općenito dostupan kroz Gemini API kao stabilna produkcijska krajnja točka. Model je optimiziran za brzinu, opseg i troškovnu učinkovitost, a preview verzija prestaje s radom 25. svibnja 2026.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
Google je 7. svibnja 2026. objavio da je model Gemini 3.1 Flash-Lite prešao iz preview faze u opću dostupnost (GA) kroz Gemini API. Stabilna krajnja točka nosi identifikator gemini-3.1-flash-lite i može se koristiti u produkcijskim radnim opterećenjima bez ograničenja preview statusa.
Što donosi GA verzija?
Prema službenom changelogu, model je “optimiziran za brzinu, opseg i troškovnu učinkovitost”. To je najjeftinija krajnja točka unutar Gemini 3.1 generacije, namijenjena scenarijima u kojima razvojni timovi šalju velike količine zahtjeva i u kojima latencija po pozivu predstavlja kritičan parametar. Tipični profili korištenja uključuju klasifikaciju, ekstrakciju strukturiranih podataka, lake chat aplikacije i pretprocesiranje velikih korpusa.
Kraj preview verzije za dva tjedna
Razvojni timovi koji su tijekom prethodnih tjedana koristili gemini-3.1-flash-lite-preview moraju migrirati na stabilni identifikator. Google navodi da preview verzija “ulazi u deprecation 11. svibnja 2026. i bit će ugašena 25. svibnja 2026.” Migracija u praksi znači zamjenu jednog stringa u konfiguraciji klijenta — ponašanje modela trebalo bi biti konzistentno između preview i GA verzije.
Pozicioniranje u Gemini 3.1 obitelji
Flash-Lite popunjava donji kraj cjenovne ljestvice unutar Gemini 3.1 obitelji, ispod standardnih Flash i Pro varijanti. GA status znači da Google preuzima formalne SLA obveze za stabilnost API ugovora i ponašanja modela, što je preduvjet za uvrštavanje u poslovne ugovore i regulirane sektore.
Što ovo znači za razvojne timove?
Timovi koji su čekali GA prije ozbiljnijeg uvođenja u proizvodnju dobivaju stabilan ugovor za nadogradnju. Oni koji već koriste preview imaju manje od tri tjedna do potpunog gašenja te krajnje točke i moraju ažurirati konfiguraciju.
Česta pitanja
- Koji je točan identifikator modela?
- Stabilna krajnja točka je `gemini-3.1-flash-lite`, dostupna kroz standardno sučelje Gemini API-ja.
- Do kada radi preview verzija?
- Preview krajnja točka `gemini-3.1-flash-lite-preview` ulazi u fazu deprecation 11. svibnja 2026., a potpuno se gasi 25. svibnja 2026.
- Za što je model namijenjen?
- Google ga pozicionira kao ekonomičnu produkcijsku opciju za primjene s visokim prometom gdje su brzina i jedinična cijena ključni.
Izvori
Povezane vijesti
Allen Institute: EMO — MoE jezični model s prirodnom semantičkom modularnošću iz podataka
OpenAI: tri nova realtime voice modela u API-ju s rezoniranjem i prevođenjem
arXiv:2605.03195: Terminus-4B — 4 milijarde parametara za terminal execution izjednačava Claude Opus i GPT-5.3-Codex na SWE-Bench Pro uz ~30 % niže tokene glavnog agenta