蚂蚁集团发布 F2LLM‑v2 多语种嵌入模型,夺 11 项 MTEB 榜单冠军实现全开源

3月26日,蚂蚁集团 CodeFuse 团队联合上海交通大学推出全新 F2LLM‑v2 系列 Embedding 模型。该模型在权威 MTEB 评测中获得 11 项语言与领域榜单第一,覆盖德语、法语、日语及代码检索任务等 430 个细分场景。F2LLM‑v2 支持 282 种自然语言及 40 余种编程语言,基于 6000 万高质量清洗样本训练,性能与多语种兼容性显著提升。模型矩阵覆盖从 80M 至 14B 全尺寸版本,支持端侧运行与动态维度调整;全部权重、代码及技术报告已全面开源,供全球开发者下载与复现。该发布进一步推动多语言语义表征与检索增强生成(RAG)模型的全球化应用。

上一篇:

下一篇:

发表回复

登录后才能评论