谷歌发布 Gemini 3.5 实时语音翻译模型，支持70多种语言互译

人工智能跨语言通信再进一步。6月9日，谷歌发布 Gemini 3.5 实时翻译模型，主打语音到语音（Speech-to-Speech）实时互译能力。该模型采用新的音频处理与语音理解技术，可自动识别并翻译全球70多种语言，实现接近实时的跨语种对话。与传统翻译工具不同，Gemini 3.5 在输出译文时可同步保留说话者的语调、语速与音高等声音特征，从而还原更自然的交流体验。谷歌表示，该模型正逐步集成至其多项产品与服务中，用于提升国际沟通和多语言协作场景的实时翻译能力。

谷歌发布 Gemini 3.5 实时语音翻译模型，支持70多种语言互译

发表回复