谷歌6月10日发布实验性开源模型DiffusionGemma,采用文本到文本扩散(text-to-text diffusion)架构,尝试以非自回归方式提升大模型推理效率。官方测试显示,在专用GPU上其文本生成速度最高可达传统自回归大语言模型的4倍。谷歌表示该模型目前主要面向研究者和开发者验证新架构,生成质量仍不及标准Gemma4,生产环境仍建议使用后者。DiffusionGemma在本地设备和低并发推理场景中速度优势更明显,在高并发云端部署中的提升有限。模型已以Apache 2.0许可证开源。