Skip to main content

Google推出Gemini 3.5 Live Translate,支援70多種語言即時翻譯

Posted in 業界新聞
新聞

Google的Live Translate最早源自Pixel Buds耳機的即時翻譯功能,當時需搭配Pixel手機與Google Translate使用。2025年底Google將該功能擴大至所有耳機裝置,而此次推出的Gemini 3.5 Live Translate,則是以新的Gemini音訊模型強化既有即時語音翻譯能力。

新的Gemini 3.5 Live Translate可直接處理串流語音輸入,不需手動設定語言,並具備較佳的背景噪音容忍能力,可應用於跨語言通話、會議、教學、直播與現場口譯等場景。Google表示,與傳統需等講者說完整句話再翻譯的系統不同,Gemini 3.5 Live Translate能持續接收語音並同步產生譯文,在翻譯品質與延遲之間取得平衡,通常僅落後講者數秒。

Google Meet未來也將改採Gemini 3.5 Live Translate作為語音翻譯核心。Google表示,相較於先前Google Meet語音翻譯功能僅支援5種語言,新版本將擴大至70多種語言與2,000多種語言組合,並提供更快速的翻譯啟用介面。

圖片來源/Google

開發者則可利用Gemini Live API,搭配Agora、LiveKit、Pipecat等即時媒體平臺快速建置語音翻譯應用。Google翻譯App用戶只要連接耳機,即可進行雙向即時語音翻譯。

所有由模型產生的音訊都會嵌入SynthID數位浮水印,以利辨識AI生成內容,降低深偽音訊與假訊息濫用風險。

目前叫車平臺Grab已測試利用該模型,讓司機與乘客在接送過程中進行近即時跨語言溝通。Gemini 3.5 Live Translate支援英文、中文、日文、韓文、西班牙文、法文、德文等逾70語言。

Preview image for Google翻譯引進Gemini原生語音能力,開始測試即時語音翻譯功能

Google翻譯引進Gemini原生語音能力,開始測試即時語音翻譯功能

除了引進新版Gemini 2.5 Flash Native Audio模型來提升文字翻譯品質,Google也同步在Android版翻譯功能測試適用於所有耳機的即時語音翻譯功能

www.ithome.com.tw
View original 0 Likes 0 Boosts

Comments (0)

No comments yet.