🟡 🤖 Modelle Freitag, 8. Mai 2026 · 2 Min. Lesezeit ·

Google: Gemini 3.1 Flash-Lite wird allgemein verfügbar

Editorial illustration: Gemini 3.1 Flash-Lite wird allgemein verfügbar

Gemini 3.1 Flash-Lite ist seit dem 7. Mai 2026 als stabiler Produktions-Endpunkt über die Gemini API allgemein verfügbar. Das Modell ist für Geschwindigkeit, Skalierung und Kosteneffizienz optimiert; die Vorschauversion wird am 25. Mai 2026 abgeschaltet.

🤖

Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.

Google gab am 7. Mai 2026 bekannt, dass das Modell Gemini 3.1 Flash-Lite von der Vorschauphase in die allgemeine Verfügbarkeit (GA) über die Gemini API übergegangen ist. Der stabile Endpunkt trägt den Bezeichner gemini-3.1-flash-lite und kann ohne die Einschränkungen des Vorschaustatus in Produktions-Workloads eingesetzt werden.

Was bringt die GA-Version?

Laut dem offiziellen Changelog ist das Modell „für Geschwindigkeit, Skalierung und Kosteneffizienz optimiert”. Es ist der günstigste Endpunkt innerhalb der Gemini-3.1-Generation, ausgerichtet auf Szenarien, in denen Entwicklungsteams große Anfragemengen senden und die Latenz pro Aufruf ein kritischer Parameter ist. Typische Nutzungsprofile umfassen Klassifizierung, strukturierte Datenextraktion, leichte Chat-Anwendungen und die Vorverarbeitung großer Korpora.

Vorschauversion endet in zwei Wochen

Entwicklungsteams, die in den vergangenen Wochen gemini-3.1-flash-lite-preview verwendet haben, müssen zum stabilen Bezeichner migrieren. Google gibt an, dass die Vorschauversion „am 11. Mai 2026 in die Deprecation-Phase eintritt und am 25. Mai 2026 abgeschaltet wird.” Die Migration bedeutet in der Praxis, einen einzigen String in der Client-Konfiguration zu ersetzen — das Modellverhalten sollte zwischen der Vorschau- und der GA-Version konsistent sein.

Positionierung in der Gemini-3.1-Familie

Flash-Lite füllt das untere Ende der Preisskala innerhalb der Gemini-3.1-Familie, unterhalb der Standard-Flash- und Pro-Varianten. Der GA-Status bedeutet, dass Google formelle SLA-Verpflichtungen für die Stabilität von API-Vertrag und Modellverhalten übernimmt — eine Voraussetzung für die Aufnahme in Geschäftsverträge und regulierte Sektoren.

Was bedeutet das für Entwicklungsteams?

Teams, die auf GA gewartet haben, bevor sie ernsthafter in die Produktion einsteigen, erhalten nun einen stabilen Vertrag. Diejenigen, die bereits die Vorschauversion nutzen, haben weniger als drei Wochen bis zur vollständigen Abschaltung und müssen ihre Konfiguration aktualisieren.

Häufig gestellte Fragen

Was ist der genaue Modell-Identifikator?
Der stabile Endpunkt lautet `gemini-3.1-flash-lite`, verfügbar über die Standard-Gemini-API-Schnittstelle.
Wie lange läuft die Vorschauversion noch?
Der Vorschau-Endpunkt `gemini-3.1-flash-lite-preview` tritt am 11. Mai 2026 in die Deprecation-Phase ein und wird am 25. Mai 2026 vollständig abgeschaltet.
Wofür ist das Modell vorgesehen?
Google positioniert es als kosteneffiziente Produktionsoption für Anwendungen mit hohem Datenaufkommen, bei denen Geschwindigkeit und Stückkosten entscheidend sind.