7.2
深览指数
产品腾讯新闻·AI寒武纪··AI 生成
Claude Code创始人最新揭秘:Claude Tag如何在团队内部"大杀四方"
Anthropic 公司内部产品负责人 Boris Cherny 和 Cat Wu 详细分享了从 Claude Code 到 Claude Tag 的演进路径:AI 从被动补全单行代码,到主动在团队协作频道中持续驱动任务。文章披露了关键评测数据(模型可连续运行 16 小时)、内部使用指标(产品团队 65% 的 PR 由 Claude Tag 提交)以及技术突破(长时自主运行与可记忆指令)。适合关注 AI 工程化落地、前沿 Agent 产品设计的技术从业者阅读。原文 ↗
核心观点
- ▍Claude Tag 代表了 LLM 交互范式的第三次变革:AI 从被动响应进化为主动驱动,能独立跟踪并完成持续数天至数周的复杂任务,并融入多人协作的工作流。
- ▍支撑 Claude Tag 落地的两项核心技术突破是模型长时间自主运行能力(METR 评测可连续工作 16 小时)和可靠的可记忆指令系统。
- 01Anthropic 内部使用数据显示,目前产品团队由 Claude Tag 提交的 PR 占比约为 65%,且比例仍在持续上升。
- 02已有 Claude Tag 会话持续运行了近一个月,作为长期实验,每天自动检查数据并在遇到问题时直接提交修复。
- 03Claude Tag 能在公开频道中工作,所有人都能看到并参与协作,降低了非工程师参与代码修改的门槛(无需处理终端、Git 等操作)。
- 04Claude Tag 设定了明确的介入分寸:经训练后能判断何时该出面、何时保持安静,且用户可调整其介入频率,它会记住并执行。
- 05公司内部的新人入职流程已改变,新员工可直接在频道中 @Claude Tag 提问法务或 HR 相关问题,因为它接入了公司信息源文件。
- 06Claude Tag 运行在与移动端、桌面端共用的远程沙盒环境,使用同一套 Agent SDK,因此具备相同的智能程度,能够自行验证工作结果(如回传验证视频)。
- 07Anthropic 内部观察到最佳实践的快速扩散现象:起初少数人使用,周围同事看到后在各自项目上快速复制。
反方 / 局限
- — 文章承认,Claude Tag 的长时间运行和记忆能力打磨了很长时间(在 Claude Code 阶段一直在尝试),直到最近才算真正做对。
- — 用户初期普遍担心 Claude Tag 拉入群聊后会过度活跃(刷存在感),这需要额外的分寸感训练与用户手动调整。
- — 文章未涉及 Claude Tag 在复杂逻辑推理或长链任务中的错误率、失败场景,以及当前仅限于 Slack 平台(Teams 等尚在计划中)的局限性。
8 分钟 · 4 卡片 · 10 资料
读原文 →