谷歌于4月2日宣布,为企业级视频创作应用Vids推出重大升级,集成Veo3.1视频生成模型与自然语言交互技术,使AI虚拟形象可根据文字提示完成与场景中物体的互动,并保持角色视觉一致性。此次更新结合此前引入的Lyria3系列音频模型,支持生成8秒视频片段,依账户类型提供每月10至1000次生成配额。Vids还新增直接导出至YouTube功能,并与Chrome录屏扩展联动,形成从素材采集到分发的全流程。与此同时,微软同期发布MAI系列基础模型,涵盖语音转录、音频及视频生成,竞争格局进一步加剧。此次迭代显示AI视频创作正迈向可指令化、专业化的自动导演阶段。