蚂蚁集团开源百灵大模型Ling-2.6-flash 推理速度提升十倍

蚂蚁集团宣布正式开源百灵大模型最新版本 Ling-2.6-flash，并同步发布 BF16、FP8、INT4 等量化版本，以支持多样硬件环境并降低 AI 部署门槛。该模型总参数量为 1040 亿，其中激活参数 74 亿，已在国际评测平台表现突出。Ling-2.6-flash 采用混合线性架构，在主流 H20 显卡上推理速度最高达每秒 340 个 Token，智效比提升约十倍，可显著降低企业算力与运营成本。模型针对智能体（Agent）应用进行了定向优化，在工具调用与长任务规划场景下表现更强。目前，Ling-2.6-flash 已于 Hugging Face 和 ModelScope 平台同步上线，蚂蚁集团表示希望通过此次开源推动全球开发者在隐私与协同创新方面探索大模型应用的新边界。

蚂蚁集团开源百灵大模型Ling-2.6-flash 推理速度提升十倍

发表回复