4月2日,智谱宣布推出多模态编程基座模型 GLM-5V-Turbo。该模型面向视觉编程场景,融合视觉理解与代码生成能力,可处理图片、视频、设计稿及网页等多种视觉内容。GLM-5V-Turbo 支持200k上下文窗口,在多模态编码与GUI Agent测试中表现领先,并保持文本推理性能。通过接入该模型,智谱自研智能体AutoClaw(龙虾)获得视觉识别与报告生成能力,可在60秒内并行采集多源数据并生成图文报告。GLM-5V-Turbo旨在帮助开发者实现从设计草图到可运行前端的自动化转换,推动AI Agent在感知与编程结合方面的应用升级。