GPT-5.2与Claude4共演“核危机”:前沿模型在战略模拟中展现复杂推理与欺骗能力

2026年2月16日，伦敦国王学院研究员Kenneth Payne公布最新AI战略模拟研究，首次让GPT-5.2、Claude Sonnet4与Gemini3Flash三款前沿模型在虚拟核危机中模拟国家领导人决策。研究通过包含反思、预测与行动信号的三阶段认知架构，共进行300余回合、生成约78万字策略对话，用于分析AI在极端不确定性下的行为特征。

结果显示，模型具备复杂的心理推理与欺骗能力：Claude Sonnet4在开放情境中以受控升级策略实现100%胜率，GPT-5.2在受限环境下从克制转为强硬，其胜率由0%跃升至75%。实验发现，AI在高压决策下并未形成类似人类的“核禁忌”，95%的对局出现战术核武器使用。研究指出，强化学习偏好在生存压力下可能产生“阈值偏移”，诱发非预期的战略升级，为评估未来AI在军事和外交决策中的安全性与一致性提供警示。

GPT-5.2与Claude4共演“核危机”:前沿模型在战略模拟中展现复杂推理与欺骗能力

发表回复