火山引擎发布豆包音频生成模型1.0(Doubao-Seed-Audio 1.0),支持文本或音频输入,端到端生成完整音频作品。用户可通过单条提示词定义多角色台词、语气、情绪、停顿及方言,并同步生成背景音乐和环境音效,减少人工多轨剪辑。模型单次支持2分钟音频生成,可通过延长功能保持长音频音色一致,并支持音色与风格解耦控制。目前火山方舟已开启API邀测,个人用户可在体验中心获得30分钟创作额度,模型将上线剪映、即梦、番茄等产品。
火山引擎发布豆包音频生成模型1.0(Doubao-Seed-Audio 1.0),支持文本或音频输入,端到端生成完整音频作品。用户可通过单条提示词定义多角色台词、语气、情绪、停顿及方言,并同步生成背景音乐和环境音效,减少人工多轨剪辑。模型单次支持2分钟音频生成,可通过延长功能保持长音频音色一致,并支持音色与风格解耦控制。目前火山方舟已开启API邀测,个人用户可在体验中心获得30分钟创作额度,模型将上线剪映、即梦、番茄等产品。