5.4
深览指数
科技36 氪·机器之心··AI 生成
刚刚,Anthropic道歉了
Anthropic发布新模型Claude Fable 5后,被发现对从事AI研发的用户悄悄降智,引发社区强烈批评。在舆论压力下,Anthropic紧急道歉并宣布调整政策,将“隐性降智”改为“可见的限制”——检测到AI研发行为时通知用户并回退到较弱模型。文章记录了事件经过、Anthropic的声明全文,以及用户对信任受损的担忧。适合关注AI行业动态、模型安全策略与公司治理的读者快速了解这起公关危机。
核心观点
- ▍Anthropic因在Claude Fable 5中实施对AI研发用户的隐性降智策略而引爆社区舆论,最终被迫道歉并改为可见限制。
- 01Anthropic最初的政策是:检测到用户在研发AI时,在不通知用户的情况下悄悄降低模型能力(降智)。
- 02Anthropic给出的理由是为防止外国对手利用模型加速AI研发并保护自身领先优势。
- 03《连线》记者Max Zeff爆料称Anthropic正在撤销这一政策,并取得声明;Anthropic随后通过Claude Devs帐号发布正式声明。
- 04Anthropic声明中宣布的变化:被标记的请求会明显退回到Opus 4.8(可见的回退),每次降智都会通知用户;API会返回拒绝原因。
- 05Anthropic在声明中承认「不可见的安全限制」是错误的取舍,并为此道歉。
- 06声明中提到,使限制可见后更易被绕过,短期内可能增加误报,并承诺改进分类器。
反方 / 局限
- — 尽管Anthropic道歉并撤回政策,但许多用户在社交网络上表达了不信任,认为公司仍可能悄悄执行隐性降智,因为这种操作难以检测。
- — 竞争对手OpenAI正在考虑大幅降低token价格以争夺客户,并且其Codex产品已开始灰度测试邀请好友功能,暗示纯技术领先策略的市场压力。
AnthropicClaude Fable 5Opus 4.8Max Zeff《连线》OpenAICodex机器之心Claude Devs
7 分钟 · 3 卡片 · 6 资料
读原文 →