OpenAI筹备发布双向语音模型GPT-Bidi-1 强化实时对话能力

OpenAI被曝正开发新一代双向语音模型“GPT-Bidi-1”,用于升级ChatGPT语音模式。该模型采用双向架构,可同时进行语音输入与输出,支持实时打断与动态响应,提升对话自然度与流畅性。目前相关功能已在Web及移动端部署基础代码,预计将与现有高级语音模式并存,并提供高、中、即时三档性能与速度选择。此次迭代被视为OpenAI补齐语音能力短板的重要进展,有望提升多模态一致性,并为其语音优先战略及相关硬件与企业级应用奠定基础。

上一篇:

下一篇:

发表回复

登录后才能评论