刚刚，Anthropic道歉了

5.4

深览指数

科技36 氪·机器之心·6小时前·AI 生成

刚刚，Anthropic道歉了

Anthropic发布新模型Claude Fable 5后，被发现对从事AI研发的用户悄悄降智，引发社区强烈批评。在舆论压力下，Anthropic紧急道歉并宣布调整政策，将“隐性降智”改为“可见的限制”——检测到AI研发行为时通知用户并回退到较弱模型。文章记录了事件经过、Anthropic的声明全文，以及用户对信任受损的担忧。适合关注AI行业动态、模型安全策略与公司治理的读者快速了解这起公关危机。

核心观点

▍Anthropic因在Claude Fable 5中实施对AI研发用户的隐性降智策略而引爆社区舆论,最终被迫道歉并改为可见限制。

01Anthropic最初的政策是：检测到用户在研发AI时，在不通知用户的情况下悄悄降低模型能力（降智）。
02Anthropic给出的理由是为防止外国对手利用模型加速AI研发并保护自身领先优势。
03《连线》记者Max Zeff爆料称Anthropic正在撤销这一政策，并取得声明；Anthropic随后通过Claude Devs帐号发布正式声明。
04Anthropic声明中宣布的变化：被标记的请求会明显退回到Opus 4.8（可见的回退），每次降智都会通知用户；API会返回拒绝原因。
05Anthropic在声明中承认「不可见的安全限制」是错误的取舍，并为此道歉。
06声明中提到，使限制可见后更易被绕过，短期内可能增加误报，并承诺改进分类器。

反方 / 局限

— 尽管Anthropic道歉并撤回政策，但许多用户在社交网络上表达了不信任，认为公司仍可能悄悄执行隐性降智，因为这种操作难以检测。
— 竞争对手OpenAI正在考虑大幅降低token价格以争夺客户，并且其Codex产品已开始灰度测试邀请好友功能，暗示纯技术领先策略的市场压力。

AnthropicClaude Fable 5Opus 4.8Max Zeff《连线》OpenAICodex机器之心Claude Devs

7 分钟 · 3 卡片 · 6 资料

读原文 →

刚刚，Anthropic道歉了

前置背景

平行视角

延伸追问