智谱发布多模态基座模型 GLM-5V-Turbo，赋能视觉编程与智能体进化

4月2日，智谱宣布推出多模态编程基座模型 GLM-5V-Turbo。该模型面向视觉编程场景，融合视觉理解与代码生成能力，可处理图片、视频、设计稿及网页等多种视觉内容。GLM-5V-Turbo 支持200k上下文窗口，在多模态编码与GUI Agent测试中表现领先，并保持文本推理性能。通过接入该模型，智谱自研智能体AutoClaw（龙虾）获得视觉识别与报告生成能力，可在60秒内并行采集多源数据并生成图文报告。GLM-5V-Turbo旨在帮助开发者实现从设计草图到可运行前端的自动化转换，推动AI Agent在感知与编程结合方面的应用升级。

智谱发布多模态基座模型 GLM-5V-Turbo，赋能视觉编程与智能体进化

发表回复