🟡 🤖 Modelle Veröffentlicht: · 2 Min. Lesezeit ·

Google: Gemini 3.5 Live Translate — Sprach-zu-Sprach-Übersetzung in 70+ Sprachen in Echtzeit

Redaktionelle Illustration: Audiowellen, die Sprechblasen in verschiedenen Schriften über einen Globus verbinden, Echtzeit-Übersetzungskonzept

Google hat Gemini 3.5 Live Translate vorgestellt — ein Sprach-zu-Sprach-Übersetzungssystem, das 70+ Sprachen und mehr als 2.000 Sprachkombinationen in Echtzeit unterstützt, die Intonation des Sprechers bewahrt und Audio mit dem SynthID-Wasserzeichen schützt.

🤖

Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.

Google hat Gemini 3.5 Live Translate vorgestellt — ein Sprach-zu-Sprach-Übersetzungssystem (Übersetzung gesprochener Sprache direkt in gesprochene Sprache einer anderen Sprache) mit einer Verzögerung von nur wenigen Sekunden. Im Gegensatz zu früheren Lösungen, die nur Englisch unterstützten, deckt die neue Version 70+ Sprachen und mehr als 2.000 Sprachkombinationen in Meetings und Anrufen ab.

Was ist Sprach-zu-Sprach-Übersetzung?

Sprach-zu-Sprach-Übersetzung — im Gegensatz zur klassischen Textübersetzung — erfasst Sprache in Echtzeit, übersetzt sie und liefert sofort übersetzte Audioinhalte an den Gesprächspartner. Gemini 3.5 Live Translate bewahrt dabei Intonation, Rhythmus und Tonhöhe des ursprünglichen Sprechers und erhält so die Natürlichkeit der Kommunikation, anstatt den roboterhaften Klang älterer Methoden zu erzeugen.

SynthID-Schutz und Verfügbarkeit

Alle generierten Audioinhalte tragen das SynthID-Wasserzeichen — Googles Standard zur Kennzeichnung synthetischer Sprache, der eine nachträgliche Authentizitätsprüfung ermöglicht und Deepfake-Audio-Missbrauch verhindert. Das System ist in der öffentlichen Developer-Preview über die Gemini Live API und Google AI Studio verfügbar, während für Google Meet Enterprise eine Private Preview läuft. Der globale Rollout in der Google Translate App (Android und iOS) ist bereits im Gange.

Ausmaß der Anwendung

Googles eigener Google Translate übersetzt mehr als eine Billion Wörter pro Monat, was den Umfang der Infrastruktur verdeutlicht, auf der das neue System aufbaut. Die Transportplattform Grab, die die Gemini Live API nutzt, verzeichnet mehr als 10 Millionen Sprachanrufe pro Monat — eine potenzielle Nutzerbasis, die sofort von mehrsprachiger Echtzeit-Übersetzung profitieren kann.

Die Verfügbarkeit auf Entwicklungsplattformen bedeutet, dass Programmierer die Übersetzung bereits jetzt in eigene Anwendungen integrieren können, während sie auf den breiteren öffentlichen Rollout warten.

Häufig gestellte Fragen

Wie viele Sprachen unterstützt Gemini 3.5 Live Translate?
Das System unterstützt 70+ Sprachen und mehr als 2.000 Sprachkombinationen — ein dramatischer Fortschritt gegenüber der Vorgängerversion, die nur Englisch unterstützte.
Ist die übersetzte Stimme vor Missbrauch geschützt?
Ja — Google versieht alle generierten Audioinhalte mit dem SynthID-Wasserzeichen, das synthetische Sprache identifizierbar macht und Missbrauch verhindert.