谷歌宣布更新 Gemini API 定价结构,推出标准、弹性、优先、批量及缓存五种服务档位,以满足不同推理应用需求。标准档位为基础服务;弹性档位利用非高峰算力资源,价格为标准档位五折,延迟约 1 至 15 分钟;批量档位同样享受五折优惠,适合大规模数据处理,延迟最长可达 24 小时。优先档位比标准价高出 75% 至 100%,可实现毫秒至秒级响应,面向实时应用场景;缓存档位则依据词元存储量和时长计费,适用于长文本、视频分析或高频查询等任务。此次调整标志着谷歌在模型服务商业化和算力资源利用上的进一步细化。