xAI发布Grok4.20:非幻觉率达78%,推理性能显著提升

2026年3月12日,xAI正式推出新一代大语言模型Grok4.20 Beta。根据Artificial Analysis评估,该模型在启用推理功能的智能指数中得分48,比前代提升6分。尽管整体性能仍低于Gemini 3.1 Pro Preview和GPT-5.4的57分,但在AA全知测试中表现突出,非幻觉率达78%,刷新业内事实可靠性纪录。xAI同步开放三种API版本,涵盖带推理、无推理及多智能体模式,支持高达200万个令牌上下文窗口。Grok4.20定价每百万令牌2至6美元,较前代明显降低。技术上,该模型在处理未知问题时更具克制,错误率降至约五分之一。此发布标志着xAI在通用人工智能领域转向以推理深度与事实准确性为核心的技术竞争。

上一篇:

下一篇:

发表回复

登录后才能评论