7.7
深览指数
职场人人都是产品经理·孙鑫··AI 生成

AI 时代的 PM 到底在做什么

文章核心观点是AI时代的产品经理(PM),其价值载体正从传统PRD迁移到定义模型行为标准的benchmark(评估体系)。作者结合自身在AI创业公司的经验,提出AI原生产品中用户体验与模型行为高度耦合,PM必须学会将“用户的成功”(L1)翻译为“Agent的成功”(L2),而这两层间的翻译工作是PM的核心壁垒。文章将PM分为停留在传统范式的Type A和掌握评估体系设计的Type B,并断言后者的差距将不断拉大。适合关注职业转型的PM、AI产品负责人及对AI原生组织运作方式感兴趣的人阅读。

核心观点
  • AI时代PM的核心职责已从写PRD转向定义模型行为标准与设计评估体系(benchmark),这是PM价值载体的根本迁移。
  • AI原生产品的benchmark本质上是将‘什么是好产品’从主观判断转化为机器可执行的规范,它具有L1(用户成功)与L2(Agent成功)两层结构。
  1. 01作者观察到自家AI创业公司接入新大模型时产品团队毫无反应,认为多数挂着AI招牌的公司只是将AI API包装成SaaS,并非AI原生组织。
  2. 02传统字节式PM方法论依赖海量用户数据(A/B test、留存率等),但AI产品面临用户行为数据不显著、行为分布不稳定等三个前提不满足的问题。
  3. 03用户体验与模型行为高度耦合是AI原生产品的特性,PM无法再像传统方式那样将用户体验与技术实现拆开。
  4. 04Anthropic CPO Mike Krieger和OpenAI CPO Kevin Weil均公开表示,评估PM能力时会考察其如何思考eval(评估),并将写eval视为核心技能。
  5. 05作者以AI销售邮件为例,说明L2(语气、合规性等过程指标)与L1(客户是否回复等结果指标)经常错位,L2满分不等于L1成功。
  6. 06文章论证PM是唯一被训练成‘同时看两层(用户与技术)’的角色,算法工程师、用户研究员、领域专家都难以独立完成L1与L2的翻译。
  7. 07作者将PM分为Type A(传统范式,只提需求看数据)和Type B(定义模型行为标准,用数据驱动算法决策),并引用OpenAI CPO观点称两类PM差距每月扩大。
反方 / 局限
  • 作者明确承认多数公司是‘AI包皮产品(SaaS加个AI助手)’,Type A PM能在其中生存,批评当前行业普遍处于非原生状态。
Mike KriegerKevin WeilOpenAIAnthropicPRDbenchmarkL1 用户成功L2 Agent成功
9 分钟 · 3 卡片 · 5 资料
读原文 →

前置背景

未来推演

延伸追问