阿里巴巴通义实验室与中国科学技术大学近日联合开源电影级多模态配音项目Fun-CineForge。该项目针对影视剧配音中口型不同步、音色单一、情感缺失等问题,推出端到端大模型与生产流水线。其核心包括基于多模态大模型(MLLM)的配音系统,可理解角色身份与情感变化,以及首个大规模中文影视配音数据集CineDub,涵盖对白、独白、多发言人等场景。2026年3月16日,Fun-CineForge正式开放模型权重与推理代码,数据集中已包含《红楼梦》《唐顿庄园》等样本。官方展示显示,该模型能在《三国演义》等剧集中实现高保真音色与自然口型同步,推动AI配音从文字合成迈向具备表演理解的智能化后期制作,加速影视内容自动化生产进程。