Google 发布轻量化模型 Gemini 3.1 Flash-Lite,推理速度提升 2.5 倍

Google DeepMind 发布新一代轻量级生成式 AI 模型 Gemini 3.1 Flash-Lite,在推理效率上取得显著突破。官方数据显示,该模型首次响应速度较前代 Gemini 2.5 Flash 提升 2.5 倍,生成吞吐量超过每秒 360 个 Token。第三方机构 Artificial Analysis 测试显示,其在多模态任务上超越部分高参数量模型,如 Claude Opus 4.6 等。Gemini 3.1 Flash-Lite 的成本相应上调,每百万 Token 价格由 0.40 美元提升至 1.50 美元。Google 同步推出基于该模型的“伪浏览器”演示,用户可通过指令实时生成网页并渲染界面,展示了在快速原型设计、动态 UI 构建及低延迟多模态任务中的应用潜力。目前该模型已登陆 Google AI Studio 与 Vertex AI 平台,面向开发者和企业用户开放使用。

上一篇:

下一篇:

发表回复

登录后才能评论