MiniMax 开源多模态模型 M3,428B 参数并实现性能与速度双提升

稀宇科技 MiniMax 宣布开源原生多模态旗舰模型 MiniMax M3,并同步开放模型权重及稀疏注意力机制相关论文。该模型总参数规模达 428B,激活参数为 23B,是业内较早在训练初期即采用多模态混合训练的开源模型。发布两周内,M3 在全球综合智能指数开源模型排名中位列第一。针对初期访问拥堵问题,官方已将推理速度由 30 TPS 提升至 80 TPS,并表示将持续优化性能。M3 同时在代码生成与智能体任务评测中表现突出,具备多步推理与工具调用能力,输出代码可直接用于实际开发场景。

上一篇:

下一篇:

发表回复

登录后才能评论