微软开源多语言嵌入模型 Harrier,支持超百种语言并上架 Hugging Face

微软 Bing 团队宣布开源新一代多语言词嵌入模型 Harrier。该模型在多语言 MTEB v2 基准测试中表现突出,支持超过 100 种语言,训练数据涵盖 20 亿个样本及来自 GPT-5 的合成数据,具备 32,000 词元上下文窗口,显著提升多语言任务的准确性与灵活性。Harrier 提供 3 个版本:27 亿参数完整版、2.7 亿参数版及 0.6 亿参数轻量版,均以 MIT 许可证在 Hugging Face 平台发布。微软表示,未来将把 Harrier 技术集成至 Bing 搜索引擎及新一代 AI 代理服务,以增强搜索与信息处理能力。该举措有望推动多语言 AI 应用的普及与发展。

上一篇:

下一篇:

发表回复

登录后才能评论