腾讯混元联合多校发布MMAE音频编辑基准,现有模型精准编辑率不足5%

腾讯混元联合上海交通大学、南洋理工大学、北京大学等多家机构发布MMAE(大规模多任务音频编辑基准),为通用指令驱动的音频编辑提供系统评测标准。该基准包含2000个真实场景样本、17741项细粒度指标,覆盖7种模态、6级任务复杂度及8类编辑操作,重点评估模型在保持原音频不变前提下的精准修改能力。测试结果显示,当前主流模型精确匹配率普遍低于5%,暴露出在指令理解、局部编辑与音质保持方面的明显不足,表明音频AI仍处于从生成向高精度编辑能力过渡阶段。

上一篇:

下一篇:

发表回复

登录后才能评论