蚂蚁集团开源百灵大模型 Ling-2.6-flash 支持多精度版本

蚂蚁集团宣布，其百灵大模型系列最新版本 Ling-2.6-flash 正式面向全球开发者开源。该模型提供 BF16、FP8 和 INT4 等多种精度版本，以适应不同硬件环境并降低部署门槛。Ling-2.6-flash 为参数量 104B、激活参数量 7.4B 的 Instruct 模型，曾以 “Elephant Alpha” 名义在 OpenRouter 平台试运行两周，期间优化了中英文切换与编程框架适配性能。模型采用混合线性架构，在 4 卡 H20 环境下推理速度达 340 tokens/s，预填充吞吐量为 Nemotron-3-Super 的 2.2 倍。任务完成 token 消耗仅约 15M，为同类产品的十分之一。该模型在 BFCL-V4 与 SWE-bench 等评测中展现出行业领先表现，现已在 Hugging Face 与 ModelScope 上开放下载。

蚂蚁集团开源百灵大模型 Ling-2.6-flash 支持多精度版本

发表回复