谷歌发布开源模型DiffusionGemma：以文本扩散架构探索更快AI推理

谷歌6月10日发布实验性开源模型DiffusionGemma，采用文本到文本扩散（text-to-text diffusion）架构，尝试以非自回归方式提升大模型推理效率。官方测试显示，在专用GPU上其文本生成速度最高可达传统自回归大语言模型的4倍。谷歌表示该模型目前主要面向研究者和开发者验证新架构，生成质量仍不及标准Gemma4，生产环境仍建议使用后者。DiffusionGemma在本地设备和低并发推理场景中速度优势更明显，在高并发云端部署中的提升有限。模型已以Apache 2.0许可证开源。

谷歌发布开源模型DiffusionGemma：以文本扩散架构探索更快AI推理

发表回复