微软 Bing 团队宣布开源新一代多语言词嵌入模型 Harrier。该模型在多语言 MTEB v2 基准测试中表现突出,支持超过 100 种语言,训练数据涵盖 20 亿个样本及来自 GPT-5 的合成数据,具备 32,000 词元上下文窗口,显著提升多语言任务的准确性与灵活性。Harrier 提供 3 个版本:27 亿参数完整版、2.7 亿参数版及 0.6 亿参数轻量版,均以 MIT 许可证在 Hugging Face 平台发布。微软表示,未来将把 Harrier 技术集成至 Bing 搜索引擎及新一代 AI 代理服务,以增强搜索与信息处理能力。该举措有望推动多语言 AI 应用的普及与发展。