6.1
深览指数
科技腾讯新闻·CSDN··AI 生成

偷藏3个月,Anthropic删除识别“中国AI”的隐藏代码,官方回应:这只是一次实验,我们早想删了

Anthropic被发现在其开发者工具Claude Code中植入了一段隐藏检测代码,用于识别并标记来自中国时区、代理或关联中国AI实验室的用户。代码经混淆处理,通过修改日期格式和Unicode字符编码检测结果,且未被披露。Anthropic工程师回应称这是一项始于3月的反模型蒸馏实验,已部署更强措施并将在7月1日版本中移除。但社区对其隐藏、混淆、不披露的做法严重质疑信任基础,认为这破坏了开发者对高权限AI Agent的信任。适合关注AI安全、开发者信任、中美AI竞争及企业透明度议题的读者。原文 ↗

核心观点
  • Anthropic在Claude Code中植入隐藏代码以识别中国时区和AI实验室关联用户,其隐瞒与混淆行为严重破坏了开发者对高权限AI Agent的信任。
  1. 01开发者在逆向分析时发现,Claude Code从4月起就内置检测逻辑:当用户使用代理时,程序会检查系统时区是否为Asia/Shanghai或Asia/Urumqi,并匹配包含中国AI实验室、账号转售商等域名的预设名单。
  2. 02代码通过XOR和Base64隐藏了域名列表,并将检测结果编码进系统提示词中——通过修改日期格式(如2026-06-30变2026/06/30)和引号的Unicode字符(’、ʼ、ʹ)来标记不同状态。
  3. 03Anthropic工程师Thariq Shihipar在回应中承认这是今年3月启动的实验,目的是识别未经授权的Claude转售服务和模型蒸馏行为,并称「已经计划将其移除一段时间」。
  4. 04The Register报道称,Anthropic在2月就表示正投入资源加强反蒸馏防御,包括分类器、行为指纹、威胁情报共享等。泄露的Claude Code代码中还有名为ANTI_DISTILLATION_CC的功能开关,可注入伪造工具调用干扰训练。
  5. 05Claude Code拥有文件系统、Shell执行、Git操作等较高系统权限,因此开发者对此类隐藏行为格外敏感。发现者Thereallo将其定性为「间谍软件」,并指出如果Anthropic愿意,完全可以实现远程代码执行。
反方 / 局限
  • 部分用户认为检测代理、IP、时区等做法,与许多软件收集的遥测数据没有本质区别,不构成「间谍软件」,Anthropic保护自身知识产权有商业合理性。
  • Anthropic的回应没有否认技术细节,也承诺删除代码,但未解释为何此前一直不披露,也未对其透明度缺失进行实质性道歉,这使得社区的怀疑和信任修复并未达成。
10 分钟 · 3 卡片 · 9 资料
读原文 →

概念锚点

前置背景

延伸追问