智谱推出多模态编程基座模型 GLM-5V-Turbo

4月2日，智谱正式发布多模态编程基座模型 GLM-5V-Turbo，定位于面向视觉编程场景的下一代 AI 模型。该模型融合视觉与代码生成能力，支持理解图片、视频、设计稿及复杂文档布局，并可通过画框、截图、网页读取等工具执行视觉任务。GLM-5V-Turbo 具备 200k 上下文窗口，可处理大型工程项目或长篇技术文档，在多模态编程与 GUI Agent 测试中表现领先。模型可根据设计稿截图或操作录屏生成前端代码，支持对话式编辑和可视化迭代。智谱同时在自研智能体 AutoClaw 中接入该模型，实现对图表和报告的视觉理解，从而完成多源数据采集与分析。官方称，此项发布标志着 AI Agent 从文本处理迈向可感知的全自动编程阶段。

智谱推出多模态编程基座模型 GLM-5V-Turbo

发表回复