火山引擎发布豆包音频生成模型1.0，支持一体化生成对白音效配乐

火山引擎发布豆包音频生成模型1.0（Doubao-Seed-Audio 1.0），支持文本或音频输入，端到端生成完整音频作品。用户可通过单条提示词定义多角色台词、语气、情绪、停顿及方言，并同步生成背景音乐和环境音效，减少人工多轨剪辑。模型单次支持2分钟音频生成，可通过延长功能保持长音频音色一致，并支持音色与风格解耦控制。目前火山方舟已开启API邀测，个人用户可在体验中心获得30分钟创作额度，模型将上线剪映、即梦、番茄等产品。

火山引擎发布豆包音频生成模型1.0，支持一体化生成对白音效配乐

发表回复