Google: Gemini Omni Flash bringt native Videogenerierung aus gemischten Eingaben
Google hat auf dem I/O 2026 Gemini Omni Flash vorgestellt — ein neues multimodales Modell, das Video aus einer Kombination von Bildern, Audio, Video und Text generiert und bearbeitet. Ab sofort auf YouTube Shorts verfügbar, mit obligatorischem SynthID-Wasserzeichen auf jedem generierten Clip.
Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.
Google hat auf der Google-I/O-2026-Konferenz offiziell Gemini Omni Flash gestartet, das erste Modell der neuen Omni-Familie, das nativ Videoinhalte aus gemischten Eingaben generiert und bearbeitet. Das ist ein bedeutender Fortschritt: Das Modell empfängt nicht nur Textanweisungen, sondern verarbeitet gleichzeitig eine Kombination aus Bildern, Audioaufnahmen, Videoclips und Text, um neues Videomaterial zu erstellen oder vorhandenes zu bearbeiten.
Was bedeutet „native Videogenerierung”?
Bisherige generative Modelle arbeiteten meist mit einer einzelnen Eingabeart — Text-zu-Video oder Bild-zu-Video-Pipelines. Gemini Omni Flash führt einen echten multimodalen Ansatz ein: Ein Nutzer kann gleichzeitig ein Referenzbild, einen Audioclip und ein kurzes Video beifügen und das gewünschte Ergebnis in natürlicher Sprache beschreiben. Das Modell integriert intern alle diese Signale und generiert ein Ausgabevideo, das Stil, Bewegung und Kontext aus jeder Quelle berücksichtigt.
Diese Fähigkeit kommt besonders beim iterativen Bearbeiten zum Tragen — der Nutzer kann das Ergebnis in mehreren Gesprächsrunden verfeinern, ohne die Szene von Grund auf neu zu beschreiben. Das Modell behält den Kontext über mehrere Überarbeitungen hinweg und wendet physikalische Gesetze wie Schwerkraft, kinetische Energie und Fluiddynamik konsistent an.
SynthID: jedes generierte Video trägt ein digitales Wasserzeichen
Die zentrale Sicherheitskomponente von Omni Flash ist Googles SynthID — ein imperceptibles digitales Wasserzeichen, das in jeden generierten Clip eingebettet wird. Das Wasserzeichen ist weder mit bloßem Auge sichtbar noch hörbar, kann aber über die Gemini-App, den Chrome-Browser und Google Search verifiziert werden.
Dieser Mechanismus antwortet direkt auf wachsende regulatorische Anforderungen an die Kennzeichnung KI-generierter Inhalte — besonders relevant im Hinblick auf den EU-KI-Act, der ab August 2026 transparente Kennzeichnung synthetischer Medien vorschreibt.
Verfügbarkeit: YouTube Shorts ab dem ersten Tag
Google hat Omni Flash sofort in YouTube Shorts und die YouTube-Create-App ohne Zusatzkosten integriert, was bedeutet, dass Hunderte Millionen Nutzer ab heute direkten Zugang zu nativer KI-Videogenerierung innerhalb der Plattform haben. Das ist der breiteste initiale Rollout eines Google-Generativmodells.
Für fortgeschrittene Nutzer ist das Modell auch über Google Flow und die Google-AI-Plus-, Pro- und Ultra-Abonnementstufen über die Gemini-App verfügbar. Entwickler- und Enterprise-APIs werden für die nächsten Wochen angekündigt.
Was kommt als nächstes für die Omni-Familie?
Google hat angekündigt, dass Omni Flash derzeit Audio-Referenzen als primären Ton-Input unterstützt, während andere Audio-Output-Typen als „coming soon” markiert sind. Langfristig soll die Omni-Familie auch direkten Audio- und Bild-Output unterstützen — was das Modell als universelles multimodales Kreativwerkzeug im Google-Ökosystem positionieren würde.
Bemerkenswert ist auch die Unterstützung der Erstellung digitaler Avatare sowie die Referenzierung von Stil, Bewegung und Effekten aus beigefügtem Material — was Möglichkeiten für personalisierte Videoproduktion in einem Maßstab eröffnet, der bisher nicht für normale Nutzer verfügbar war.
Häufig gestellte Fragen
- Was ist Gemini Omni Flash und was unterscheidet es von bisherigen Modellen?
- Gemini Omni Flash ist Googles erstes Modell der Omni-Familie, das Geminisrs Reasoning-Kapazität mit nativer Videogenerierung kombiniert. Es akzeptiert Bilder, Audio, Video und Text gleichzeitig als Eingabe und erstellt oder bearbeitet daraus direkt Videoinhalte.
- Ist Gemini Omni Flash kostenlos verfügbar?
- Teilweise — kostenloser Zugang ist über Google Flow, YouTube Shorts und die YouTube-Create-App möglich. Google-AI-Plus-, Pro- und Ultra-Abonnenten haben Zugang über die Gemini-App; Entwickler- und Enterprise-APIs werden für die nächsten Wochen angekündigt.
- Was ist das SynthID-Wasserzeichen und warum ist es wichtig?
- SynthID ist Googles unhörbares und unsichtbares digitales Wasserzeichen, das in jeden von Omni Flash generierten Video-Clip eingebettet wird. Es ermöglicht die Prüfung des KI-Ursprungs über die Gemini-App, Chrome und Google Search — eine wichtige Maßnahme gegen Desinformation und relevant für den EU-KI-Act.