美团 LongCat-Flash-Lite 震撼发布:45 亿激活参数性能比肩巨量模型

美团发布新模型LongCat-Flash-Lite,采用“嵌入扩展”架构,激活参数仅45亿但性能堪比巨量模型。模型总参数达685亿,其中超300亿分配至N-gram嵌入层,精准捕获局部语义,显著提升理解精度。系统层面通过智能参数分配、专用缓存优化及推测解码协同,实现高效推理,生成速度达500-700 token/s,支持最长256K上下文。

在多项基准测试中表现优异:智能体任务、电信、航空等场景均获最高分,代码能力准确率达54.4%,通用素质MMLU得分85.52。美团已开源模型权重及配套推理引擎,开发者可通过开放平台申请试用,每日享5000万tokens免费额度。

上一篇:

下一篇:

发表回复

登录后才能评论