7.5
深览指数
科技腾讯新闻··AI 生成

40万次Claude Code会话实锤:这才是AI时代最值钱的本事

Anthropic基于2025年10月至2026年4月期间约23.5万用户、近40万次Claude Code会话数据,得出核心结论:AI编程中决定产出效率的关键不是代码能力,而是对业务或问题本身的深度理解。报告显示,人类负责约70%的规划决策,AI包揽约80%的执行决策;懂行的用户(即使是会计)能从AI身上榨出数倍于新手(即使是程序员)的产能。这一发现挑战了'AI时代最值钱的是技术能力'的主流认知,并为知识型工作的未来分工提供了早期信号。适合关注AI对职业结构影响的从业者、管理者和技术决策者阅读。原文 ↗

核心观点
  • 决定AI编程成败的核心不是代码功底,而是对业务或问题域的深度理解。
  • 在AI时代,最稀缺的能力已从'执行代码'转向'定义问题'。
  1. 01Anthropic分析约23.5万用户、近40万次Claude Code会话得出数据:人类做了约70%的规划决策,AI包揽约80%的执行决策。
  2. 02专业度是'任务特定的':一个从未写过Python的会计,只要能精确描述对账规则并识别AI遗漏的边界情况,在该任务上就是专家。
  3. 03新手会话每条指令仅触发约5个Claude动作、输出约600词;专家会话动作链翻倍至12个,输出飙升至3200词(5倍差距)。
  4. 04按严格验证标准,新手会话成功率仅15%,中级用户达28%,高级和专家达33%;最大提升发生在从新手到中级阶段。
  5. 05当会话遇阻时,新手最终翻盘概率仅4%,专家为15%;19%的新手在失败后直接放弃,而其他水平用户仅5%-7%。
  6. 06软件相关职业验证成功率约30%,其他职业约26%;按更宽泛标准,差距缩至1个百分点(89%对88%)。管理岗的验证成功率甚至略高于程序员。
  7. 07当用户掌握更多执行决策权时,Claude每轮仅约8个动作;当Claude获得规划主导权时,每轮飙升至16个动作。
反方 / 局限
  • Anthropic承认,报告中的'成功率'基于对会话记录的分类判断,不等于代码最终被采用或产生了真实商业价值,结论是初步的。
AnthropicClaude Code美国劳工统计局 (BLS)决策归因分类器规划决策执行决策
9 分钟 · 4 卡片 · 8 资料
读原文 →

前置背景

平行视角

未来推演

延伸追问