Google: Gemini 3.5 Live Translate — prijevod govor-u-govor u 70+ jezika u stvarnom vremenu
Google je lansirao Gemini 3.5 Live Translate — sustav za speech-to-speech prijevod koji podržava 70+ jezika i više od 2.000 jezičnih kombinacija u stvarnom vremenu, uz očuvanje intonacije i zaštitu SynthID vodenim žigom.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
Google je predstavio Gemini 3.5 Live Translate — sustav za speech-to-speech prijevod (prevođenje izgovorene riječi direktno u izgovorenu riječ na drugom jeziku) s kašnjenjem od svega nekoliko sekundi. Za razliku od prethodnih rješenja koja su podržavala samo engleski, nova verzija pokriva 70+ jezika i više od 2.000 jezičnih kombinacija u sastancima i pozivima.
Što je speech-to-speech prijevod?
Speech-to-speech — za razliku od klasičnog prevođenja teksta — hvata govor u stvarnom vremenu, prevodi ga i odmah isporučuje prevedeni audio sugovorniku. Gemini 3.5 Live Translate pritom čuva intonaciju, ritam i visinu glasa izvornog govornika, čime se zadržava prirodnost komunikacije umjesto robotskog tona kakvog donose starije metode.
SynthID zaštita i dostupnost
Sav generirani audio sadržaj nosi SynthID vodeni žig — Googleov standard za označavanje sintetičkog govora koji omogućuje naknadnu provjeru autentičnosti i sprječava zlouporabu deepfake audiom. Sustav je dostupan u developer public preview putem Gemini Live API-ja i Google AI Studija, dok je za Google Meet Enterprise u tijeku private preview. Globalni rollout na Google Translate aplikaciji (Android i iOS) već je u tijeku.
Razmjeri primjene
Googleov vlastiti Google Translate prevodi više od jednog bilijuna riječi svaki mjesec, što daje uvid u razmjere infrastrukture na kojoj počiva novi sustav. Platforma za prijevoz Grab, koja koristi Gemini Live API, bilježi više od 10 milijuna glasovnih poziva mjesečno — potencijalna baza korisnika koja može odmah profitirati od višejezičnog prijevoda u stvarnom vremenu.
Dostupnost na razvojnim platformama znači da programeri već sada mogu integrirati prijevod u vlastite aplikacije, dok čekaju širi javni rollout.
Česta pitanja
- Na koliko jezika radi Gemini 3.5 Live Translate?
- Sustav podržava 70+ jezika i više od 2.000 jezičnih kombinacija, što je dramatičan napredak u odnosu na raniju verziju koja je podržavala samo engleski jezik.
- Je li prevedeni glas zaštićen od zlouporabe?
- Da — Google primjenjuje SynthID vodeni žig na sav generirani audio sadržaj, čime je moguće identificirati sintetički govor i spriječiti zlouporabu.
Povezane vijesti
arXiv:2606.24510: RaDaR — specijalizirani 32B reasoning LLM ubrzava dijagnozu rijetkih bolesti u RCT-u
arXiv:2606.24014: RL treniranje na zdravstvenom domenu prenosi usklađenost na 80%+ OOD benchmarka
Google: DiffusionGemma 26B — 4× brža generacija teksta difuzijskim pristupom