谷歌发布 Gemini 3.5 实时语音翻译模型,支持70多种语言互译

人工智能跨语言通信再进一步。6月9日,谷歌发布 Gemini 3.5 实时翻译模型,主打语音到语音(Speech-to-Speech)实时互译能力。该模型采用新的音频处理与语音理解技术,可自动识别并翻译全球70多种语言,实现接近实时的跨语种对话。与传统翻译工具不同,Gemini 3.5 在输出译文时可同步保留说话者的语调、语速与音高等声音特征,从而还原更自然的交流体验。谷歌表示,该模型正逐步集成至其多项产品与服务中,用于提升国际沟通和多语言协作场景的实时翻译能力。

上一篇:

下一篇:

发表回复

登录后才能评论