2026年3月24日,美团龙猫(LongCat)团队发布并开源数学形式化与定理证明模型 LongCat-Flash-Prover。该模型针对大语言模型在逻辑推演中的局限,采用自动形式化、草稿生成与证明生成三阶段架构,实现从概率推断向逻辑证明的转变。凭借工具集成推理(TIR)策略,模型在 MiniF2F-Test 基准中以72次推理预算取得97.1%通过率,刷新开源 Prover 模型纪录,并在 MathOlympiad-Bench、PutnamBench 等任务上表现领先。技术上,该模型构建混合专家迭代框架,集成 Lean4Server 校验与多重一致性检测机制,提升逻辑严密性与训练稳定性。目前相关代码与报告已在 GitHub 与 Hugging Face 平台公开。