北京时间4月3日,谷歌正式推出开源大模型系列 Gemma4,共包含四种规格:E2B(2.3B)、E4B(4.5B)、26B MoE 和 31B 稠密模型。该系列基于 Gemini3 技术栈构建,全面支持多模态输入,其中 E2B 与 E4B 版本原生支持语音输入,可实现端侧的实时语音理解。31B 模型在 Arena AI 文本榜单中位列全球开源模型第三,26B 版本排名第六。Gemma4 在硬件效率方面优化显著,31B 模型非量化版本可在单块 80GB H100 显卡上运行,量化版兼容消费级设备。轻量版模型还针对移动端及 IoT 场景,通过 PLE 嵌入技术和 128K 长上下文支持,实现低延迟推理。该系列以 Apache 2.0 协议开源,旨在降低高性能 AI 能力的应用门槛。