微软必应团队于4月7日宣布开源全新词嵌入模型系列Harrier,用于提升搜索、检索及AI代理的语义理解能力。该系列包含0.6B、2.7B及旗舰级27B三个版本,其中27B模型在多语言MTEB v2基准测试中排名第一,超越OpenAI、亚马逊和Google等主流专有模型。Harrier支持超100种语言,上下文窗口达3.2万词元,训练数据包括超过20亿真实示例及来自GPT-5的合成数据。所有版本均采用MIT许可证在Hugging Face平台开放。微软计划将该技术应用于Bing搜索和下一代AI代理服务,进一步强化检索增强生成(RAG)系统性能,加速多语言AI在全球的应用落地。