AI 时代的 PM 到底在做什么

7.7

深览指数

职场人人都是产品经理·孙鑫·10小时前·AI 生成

AI 时代的 PM 到底在做什么

文章核心观点是AI时代的产品经理（PM），其价值载体正从传统PRD迁移到定义模型行为标准的benchmark（评估体系）。作者结合自身在AI创业公司的经验，提出AI原生产品中用户体验与模型行为高度耦合，PM必须学会将“用户的成功”（L1）翻译为“Agent的成功”（L2），而这两层间的翻译工作是PM的核心壁垒。文章将PM分为停留在传统范式的Type A和掌握评估体系设计的Type B，并断言后者的差距将不断拉大。适合关注职业转型的PM、AI产品负责人及对AI原生组织运作方式感兴趣的人阅读。

核心观点

▍AI时代PM的核心职责已从写PRD转向定义模型行为标准与设计评估体系（benchmark），这是PM价值载体的根本迁移。
▍AI原生产品的benchmark本质上是将‘什么是好产品’从主观判断转化为机器可执行的规范，它具有L1（用户成功）与L2（Agent成功）两层结构。

01作者观察到自家AI创业公司接入新大模型时产品团队毫无反应，认为多数挂着AI招牌的公司只是将AI API包装成SaaS，并非AI原生组织。
02传统字节式PM方法论依赖海量用户数据（A/B test、留存率等），但AI产品面临用户行为数据不显著、行为分布不稳定等三个前提不满足的问题。
03用户体验与模型行为高度耦合是AI原生产品的特性，PM无法再像传统方式那样将用户体验与技术实现拆开。
04Anthropic CPO Mike Krieger和OpenAI CPO Kevin Weil均公开表示，评估PM能力时会考察其如何思考eval（评估），并将写eval视为核心技能。
05作者以AI销售邮件为例，说明L2（语气、合规性等过程指标）与L1（客户是否回复等结果指标）经常错位，L2满分不等于L1成功。
06文章论证PM是唯一被训练成‘同时看两层（用户与技术）’的角色，算法工程师、用户研究员、领域专家都难以独立完成L1与L2的翻译。
07作者将PM分为Type A（传统范式，只提需求看数据）和Type B（定义模型行为标准，用数据驱动算法决策），并引用OpenAI CPO观点称两类PM差距每月扩大。

反方 / 局限

— 作者明确承认多数公司是‘AI包皮产品（SaaS加个AI助手）’，Type A PM能在其中生存，批评当前行业普遍处于非原生状态。

Mike KriegerKevin WeilOpenAIAnthropicPRDbenchmarkL1 用户成功L2 Agent成功

9 分钟 · 3 卡片 · 5 资料

读原文 →

AI 时代的 PM 到底在做什么

前置背景

未来推演

延伸追问