谷歌近日发布实时语音到语音翻译模型 Gemini 3.5 Live Translate,并已集成至 Google AI Studio、Google 翻译和 Google Meet。该模型可在对话过程中持续生成译文,实现接近同声传译的低延迟翻译,同时保留说话人的语调、节奏和音高,减少传统“说一句译一句”的停顿体验。系统支持超过70种语言自动识别与互译,并通过 Gemini Live API 向开发者开放,可应用于多语种通话、在线教育和直播解说等场景。出行平台 Grab 已在大规模司乘沟通中试用。未来 Google Meet 的会议翻译语言组合将扩展至2000多种,相关音频内容同时嵌入 SynthID 数字水印以标识 AI 生成。