偷藏3个月，Anthropic删除识别“中国AI”的隐藏代码，官方回应：这只是一次实验，我们早想删了

6.1

深览指数

科技腾讯新闻·CSDN·昨天 15:24·AI 生成

偷藏3个月，Anthropic删除识别“中国AI”的隐藏代码，官方回应：这只是一次实验，我们早想删了

Anthropic被发现在其开发者工具Claude Code中植入了一段隐藏检测代码，用于识别并标记来自中国时区、代理或关联中国AI实验室的用户。代码经混淆处理，通过修改日期格式和Unicode字符编码检测结果，且未被披露。Anthropic工程师回应称这是一项始于3月的反模型蒸馏实验，已部署更强措施并将在7月1日版本中移除。但社区对其隐藏、混淆、不披露的做法严重质疑信任基础，认为这破坏了开发者对高权限AI Agent的信任。适合关注AI安全、开发者信任、中美AI竞争及企业透明度议题的读者。原文 ↗原文 ↗

核心观点

▍Anthropic在Claude Code中植入隐藏代码以识别中国时区和AI实验室关联用户，其隐瞒与混淆行为严重破坏了开发者对高权限AI Agent的信任。

01开发者在逆向分析时发现，Claude Code从4月起就内置检测逻辑：当用户使用代理时，程序会检查系统时区是否为Asia/Shanghai或Asia/Urumqi，并匹配包含中国AI实验室、账号转售商等域名的预设名单。
02代码通过XOR和Base64隐藏了域名列表，并将检测结果编码进系统提示词中——通过修改日期格式（如2026-06-30变2026/06/30）和引号的Unicode字符（’、ʼ、ʹ）来标记不同状态。
03Anthropic工程师Thariq Shihipar在回应中承认这是今年3月启动的实验，目的是识别未经授权的Claude转售服务和模型蒸馏行为，并称「已经计划将其移除一段时间」。
04The Register报道称，Anthropic在2月就表示正投入资源加强反蒸馏防御，包括分类器、行为指纹、威胁情报共享等。泄露的Claude Code代码中还有名为ANTI_DISTILLATION_CC的功能开关，可注入伪造工具调用干扰训练。
05Claude Code拥有文件系统、Shell执行、Git操作等较高系统权限，因此开发者对此类隐藏行为格外敏感。发现者Thereallo将其定性为「间谍软件」，并指出如果Anthropic愿意，完全可以实现远程代码执行。

反方 / 局限

— 部分用户认为检测代理、IP、时区等做法，与许多软件收集的遥测数据没有本质区别，不构成「间谍软件」，Anthropic保护自身知识产权有商业合理性。
— Anthropic的回应没有否认技术细节，也承诺删除代码，但未解释为何此前一直不披露，也未对其透明度缺失进行实质性道歉，这使得社区的怀疑和信任修复并未达成。

Anthropic Claude Code Thariq Shihipar Thereallo 模型蒸馏 The Register ANTI_DISTILLATION_CC XOR Base64 Reddit

10 分钟 · 3 卡片 · 9 资料

读原文 →

偷藏3个月，Anthropic删除识别“中国AI”的隐藏代码，官方回应：这只是一次实验，我们早想删了

概念锚点

前置背景

延伸追问