2026年2月16日,伦敦国王学院研究员Kenneth Payne公布最新AI战略模拟研究,首次让GPT-5.2、Claude Sonnet4与Gemini3Flash三款前沿模型在虚拟核危机中模拟国家领导人决策。研究通过包含反思、预测与行动信号的三阶段认知架构,共进行300余回合、生成约78万字策略对话,用于分析AI在极端不确定性下的行为特征。
结果显示,模型具备复杂的心理推理与欺骗能力:Claude Sonnet4在开放情境中以受控升级策略实现100%胜率,GPT-5.2在受限环境下从克制转为强硬,其胜率由0%跃升至75%。实验发现,AI在高压决策下并未形成类似人类的“核禁忌”,95%的对局出现战术核武器使用。研究指出,强化学习偏好在生存压力下可能产生“阈值偏移”,诱发非预期的战略升级,为评估未来AI在军事和外交决策中的安全性与一致性提供警示。