Google: Gemini 3.5 Live Translate — 70言語以上でリアルタイム音声翻訳
GoogleはGemini 3.5 Live Translateを発表しました。リアルタイムでの音声変換翻訳システムで、70言語以上と2,000以上の言語の組み合わせをサポートし、声の抑揚を保持しながらSynthID電子透かしで保護されています。
この記事はAIにより一次情報源から生成されました。
Googleはリアルタイムでの音声変換翻訳(話された言葉を直接別の言語の話された言葉に変換する)システム、Gemini 3.5 Live Translateを発表しました。遅延はわずか数秒です。英語のみをサポートしていた以前のソリューションとは異なり、新バージョンは会議や通話において70言語以上と2,000以上の言語の組み合わせをカバーします。
音声変換翻訳とは何か?
音声変換翻訳(speech-to-speech)は、従来のテキスト翻訳とは異なり、リアルタイムで音声をキャプチャし、翻訳してすぐに翻訳された音声を相手方に届けます。Gemini 3.5 Live Translateは、元の話者の抑揚、リズム、音声の高さを保持しており、古い方法が持ちがちなロボット的な音調ではなく、自然なコミュニケーションを維持します。
SynthID保護と利用可能性
すべてのAI生成音声コンテンツには、SynthID電子透かし — 後続の真正性確認とディープフェイク音声の悪用防止を可能にするGoogleの合成音声マーキング標準 — が付与されます。システムはGemini Live APIとGoogle AI Studioを通じて開発者向けのパブリックプレビューで利用可能で、Google Meet Enterpriseでは現在プライベートプレビュー中です。Androidおよびi0SのGoogle Translateアプリへのグローバルロールアウトは既に進行中です。
適用の規模
GoogleはGoogle Translateで毎月10億語以上を翻訳しており、新システムが依拠するインフラの規模を示しています。Gemini Live APIを使用するライドシェアプラットフォームのGrabは月間1,000万件以上の音声通話を記録しており、リアルタイムの多言語翻訳から即座に恩恵を受ける可能性のあるユーザーベースです。
開発プラットフォームでの利用可能性は、デベロッパーが広範な公開ロールアウトを待ちながら、今すぐ自身のアプリケーションに翻訳を統合できることを意味します。
よくある質問
- Gemini 3.5 Live Translateは何言語に対応していますか?
- このシステムは70言語以上と2,000以上の言語の組み合わせをサポートしており、英語のみをサポートしていた以前のバージョンから劇的に進歩しています。
- 翻訳された音声は悪用から保護されていますか?
- はい — GoogleはすべてのAI生成音声コンテンツにSynthID電子透かしを適用しており、合成音声の識別と悪用の防止が可能です。