Google: Gemini 3.5 Live Translate — 실시간 70개 이상 언어 음성 통역
Google이 Gemini 3.5 Live Translate를 출시했습니다. 70개 이상 언어와 2,000개 이상 언어 조합을 실시간으로 지원하는 음성-음성 번역 시스템으로, 억양을 보존하고 SynthID 워터마크로 보호됩니다.
이 기사는 AI가 1차 출처를 기반으로 생성했습니다.
Google이 Gemini 3.5 Live Translate를 발표했습니다 — 수초의 지연으로 음성-음성 번역(발화된 말을 직접 다른 언어의 발화된 말로 번역)하는 시스템입니다. 영어만 지원하던 이전 솔루션과 달리 새 버전은 회의와 통화에서 70개 이상 언어와 2,000개 이상의 언어 조합을 지원합니다.
음성-음성 번역이란 무엇입니까?
음성-음성은 — 고전적인 텍스트 번역과 달리 — 실시간으로 음성을 캡처하고, 번역하고, 즉시 번역된 오디오를 상대방에게 전달합니다. Gemini 3.5 Live Translate는 원화자의 억양, 리듬, 음조를 보존해 구형 방식의 로봇 같은 톤 대신 자연스러운 커뮤니케이션을 유지합니다.
SynthID 보호 및 가용성
생성된 모든 오디오 콘텐츠에는 SynthID 워터마크 — 합성 음성 표시를 위한 Google 표준으로 사후 진위 확인과 딥페이크 오디오 오용 방지를 가능하게 함 — 가 적용됩니다. 시스템은 Gemini Live API와 Google AI Studio를 통한 개발자 공개 미리보기로 제공되며, Google Meet Enterprise의 경우 비공개 미리보기가 진행 중입니다. Android 및 iOS의 Google 번역 앱에 대한 글로벌 롤아웃이 이미 진행 중입니다.
적용 규모
Google 자체의 Google 번역은 매월 10억 개 이상의 단어를 번역합니다. 이는 새 시스템이 기반하는 인프라의 규모를 보여줍니다. Gemini Live API를 사용하는 교통 플랫폼 Grab은 월 1,000만 건 이상의 음성 통화를 기록합니다 — 실시간 다국어 번역으로 즉시 이익을 볼 수 있는 잠재적 사용자 기반입니다.
개발 플랫폼에서의 가용성은 개발자가 더 넓은 공개 롤아웃을 기다리는 동안 이미 자체 애플리케이션에 번역을 통합할 수 있음을 의미합니다.
자주 묻는 질문
- Gemini 3.5 Live Translate는 몇 개 언어를 지원합니까?
- 시스템은 70개 이상의 언어와 2,000개 이상의 언어 조합을 지원합니다. 영어만 지원하던 이전 버전에서 획기적으로 발전한 것입니다.
- 번역된 음성이 오용으로부터 보호됩니까?
- 예 — Google은 생성된 모든 오디오 콘텐츠에 SynthID 워터마크를 적용합니다. 이를 통해 합성 음성을 식별하고 오용을 방지할 수 있습니다.