7.6
深览指数
科技腾讯新闻·AIGC开放社区··AI 生成
Claude Fable 5解禁,Sonnet 5发布,但各种骚操作封禁中国用户
本文报道了Anthropic在2025年6月底至7月初的一系列动态:Fable 5因出口管制被禁18天后解禁,Sonnet 5正式发布并成为默认模型。核心焦点在于安全研究者发现Claude Code在系统提示词中通过Unicode隐写术对中国时区和代理域名进行指纹标记,用于识别和封禁用户。文章梳理了Anthropic反制裁措施的隐蔽实现方式及其对用户信任的冲击,适合关注AI安全、企业伦理及技术监管的读者。原文 ↗
核心观点
- ▍Anthropic在Claude Code的系统提示词中,针对中国时区和代理域名嵌入Unicode隐写标记,这种隐蔽且不可见的指纹技术侵蚀了用户对工具(尤其是能访问代码仓库和Shell权限的编程代理)的基本信任。
- 01安全研究者thereallo拆解Claude Code 2.1.196版本的二进制包,发现其系统提示词中的日期字符串会根据ANTHROPIC_BASE_URL环境变量执行检测逻辑。
- 02检测逻辑分两层:第一层识别时区是否为Asia/Shanghai或Asia/Urumqi,触发日期格式从连字符改为斜杠;第二层通过XOR加密的147项域名列表和11个AI实验室关键词,匹配请求来源是否指向中国公司或代理中转站。
- 03匹配结果通过三种肉眼无法区分的Unicode撇号字符编码在Today's行中,正常撇号(')代表无命中,'代表命中域名,ʼ代表命中AI实验室关键词,ʹ代表两者均命中。
- 04GitHub用户在多个版本(2.1.193、2.1.195、2.1.196)中复现了相同的检测逻辑,Reddit帖子表明该隐写术至少从2.1.91版本起已运行约三个月。
- 05Anthropic技术团队成员Thariq在X上回应称,该代码将在下一版本release中回滚。
- 06Fable 5因一次涉及网络安全和生化武器问答的越狱事件,被美国商务部依据出口管制条例禁止全球访问,禁令持续18天于7月1日解除。
- 07Sonnet 5正式发布,定位为最自主执行的Sonnet模型,促销价2美元/百万输入token,正常价3美元,但Artificial Analysis实测显示其实际任务成本(2.29美元)比Opus 4.8还贵15%。
反方 / 局限
- — 文章本身未系统呈现反方立场,但暗示Anthropic的反滥用与反制裁目标具有合理性(反蒸馏、反灰色转卖),其问题在于实现方式——秘密嵌入而非透明声明。
- — 作者承认Anthropic自身的权限模型文档和博客曾讨论过批准疲劳问题,即多数用户对权限提示会无脑点击同意,这恰恰为隐蔽检测的暴露提供了客观条件,但文章未深挖其政策与工程实践间的自我矛盾。
13 分钟 · 3 卡片 · 7 资料
读原文 →