Google: Gemini 3.1 Flash TTS bringt ausdrucksstarke KI-Sprache in mehr als 70 Sprachen
Google hat Gemini 3.1 Flash TTS lanciert, ein neues Text-to-Speech-Modell mit Unterstützung für mehr als 70 Sprachen und einem Elo-Wert von 1.211 auf der Artificial-Analysis-Rangliste. Die Schlüsselinnovation sind Audio-Tags — das Einbetten von Natural-Language-Befehlen direkt in den Text zur präzisen Steuerung von Stimme, Intonation und Emotionen. Das Modell ist auf Google AI Studio, Vertex AI und Google Vids verfügbar, mit SynthID-Wasserzeichen zur Erkennung KI-generierter Audioinhalte.