谷歌Vids集成Veo3.1模型，实现文字指令控制AI虚拟形象互动

谷歌于4月2日宣布，为企业级视频创作应用Vids推出重大升级，集成Veo3.1视频生成模型与自然语言交互技术，使AI虚拟形象可根据文字提示完成与场景中物体的互动，并保持角色视觉一致性。此次更新结合此前引入的Lyria3系列音频模型，支持生成8秒视频片段，依账户类型提供每月10至1000次生成配额。Vids还新增直接导出至YouTube功能，并与Chrome录屏扩展联动，形成从素材采集到分发的全流程。与此同时，微软同期发布MAI系列基础模型，涵盖语音转录、音频及视频生成，竞争格局进一步加剧。此次迭代显示AI视频创作正迈向可指令化、专业化的自动导演阶段。

谷歌Vids集成Veo3.1模型，实现文字指令控制AI虚拟形象互动

发表回复