智谱推出多模态编程基座模型 GLM-5V-Turbo

4月2日,智谱正式发布多模态编程基座模型 GLM-5V-Turbo,定位于面向视觉编程场景的下一代 AI 模型。该模型融合视觉与代码生成能力,支持理解图片、视频、设计稿及复杂文档布局,并可通过画框、截图、网页读取等工具执行视觉任务。GLM-5V-Turbo 具备 200k 上下文窗口,可处理大型工程项目或长篇技术文档,在多模态编程与 GUI Agent 测试中表现领先。模型可根据设计稿截图或操作录屏生成前端代码,支持对话式编辑和可视化迭代。智谱同时在自研智能体 AutoClaw 中接入该模型,实现对图表和报告的视觉理解,从而完成多源数据采集与分析。官方称,此项发布标志着 AI Agent 从文本处理迈向可感知的全自动编程阶段。

上一篇:

下一篇:

发表回复

登录后才能评论