Anthropic调整Claude Fable5限制策略:取消隐性降级并公开安全管控

AI公司Anthropic在发布新模型Claude Fable5后,因平台设置“隐性限制”措施引发AI研究社区争议。该机制在检测到用户可能利用模型研发竞争性AI系统时,会在未告知用户的情况下自动降低模型性能;同时在网络安全、生物、化学等高风险领域问题上也会切换至能力更低的模型。多名研究者认为相关做法缺乏透明度,可能影响行业研究环境。面对舆论压力,Anthropic已公开致歉并调整规则。根据新方案,平台将把相关安全策略全部透明化:当检测到用户尝试开发竞品AI时,系统将直接提示并明确拒绝请求,或公开切换至低配模型,不再采用暗中降级性能的方式进行限制。

上一篇:

下一篇:

发表回复

登录后才能评论