蚂蚁集团宣布,其百灵大模型系列最新版本 Ling-2.6-flash 正式面向全球开发者开源。该模型提供 BF16、FP8 和 INT4 等多种精度版本,以适应不同硬件环境并降低部署门槛。Ling-2.6-flash 为参数量 104B、激活参数量 7.4B 的 Instruct 模型,曾以 “Elephant Alpha” 名义在 OpenRouter 平台试运行两周,期间优化了中英文切换与编程框架适配性能。模型采用混合线性架构,在 4 卡 H20 环境下推理速度达 340 tokens/s,预填充吞吐量为 Nemotron-3-Super 的 2.2 倍。任务完成 token 消耗仅约 15M,为同类产品的十分之一。该模型在 BFCL-V4 与 SWE-bench 等评测中展现出行业领先表现,现已在 Hugging Face 与 ModelScope 上开放下载。