谷歌发布 Gemini 3.5 Live Translate 实时语音翻译模型，支持70余种语言同传

谷歌近日发布实时语音到语音翻译模型 Gemini 3.5 Live Translate，并已集成至 Google AI Studio、Google 翻译和 Google Meet。该模型可在对话过程中持续生成译文，实现接近同声传译的低延迟翻译，同时保留说话人的语调、节奏和音高，减少传统“说一句译一句”的停顿体验。系统支持超过70种语言自动识别与互译，并通过 Gemini Live API 向开发者开放，可应用于多语种通话、在线教育和直播解说等场景。出行平台 Grab 已在大规模司乘沟通中试用。未来 Google Meet 的会议翻译语言组合将扩展至2000多种，相关音频内容同时嵌入 SynthID 数字水印以标识 AI 生成。

谷歌发布 Gemini 3.5 Live Translate 实时语音翻译模型，支持70余种语言同传

发表回复