Anthropic调整Claude Fable5限制策略：取消隐性降级并公开安全管控

AI公司Anthropic在发布新模型Claude Fable5后，因平台设置“隐性限制”措施引发AI研究社区争议。该机制在检测到用户可能利用模型研发竞争性AI系统时，会在未告知用户的情况下自动降低模型性能；同时在网络安全、生物、化学等高风险领域问题上也会切换至能力更低的模型。多名研究者认为相关做法缺乏透明度，可能影响行业研究环境。面对舆论压力，Anthropic已公开致歉并调整规则。根据新方案，平台将把相关安全策略全部透明化：当检测到用户尝试开发竞品AI时，系统将直接提示并明确拒绝请求，或公开切换至低配模型，不再采用暗中降级性能的方式进行限制。

Anthropic调整Claude Fable5限制策略：取消隐性降级并公开安全管控

发表回复