Google 发布轻量化模型 Gemini 3.1 Flash-Lite，推理速度提升 2.5 倍

Google DeepMind 发布新一代轻量级生成式 AI 模型 Gemini 3.1 Flash-Lite，在推理效率上取得显著突破。官方数据显示，该模型首次响应速度较前代 Gemini 2.5 Flash 提升 2.5 倍，生成吞吐量超过每秒 360 个 Token。第三方机构 Artificial Analysis 测试显示，其在多模态任务上超越部分高参数量模型，如 Claude Opus 4.6 等。Gemini 3.1 Flash-Lite 的成本相应上调，每百万 Token 价格由 0.40 美元提升至 1.50 美元。Google 同步推出基于该模型的“伪浏览器”演示，用户可通过指令实时生成网页并渲染界面，展示了在快速原型设计、动态 UI 构建及低延迟多模态任务中的应用潜力。目前该模型已登陆 Google AI Studio 与 Vertex AI 平台，面向开发者和企业用户开放使用。

Google 发布轻量化模型 Gemini 3.1 Flash-Lite，推理速度提升 2.5 倍

发表回复