7.7
深览指数
科技腾讯新闻·科技狐··AI 生成

别写 prompt 了,CodeX 新功能来了

本文介绍了 OpenAI 桌面端应用 Codex 的新功能「Record & Replay」,它允许用户通过演示操作流程来教会 AI 执行重复性任务,例如自动填写报销单。文章指出,该功能的核心价值在于 AI 能理解操作逻辑(如识别字段、匹配文件),而非像传统录宏那样记录死板的像素坐标和点击顺序。作者(HQL)既认可该功能在提升非程序员群体自动化能力方面的潜力,也尖锐地指出了其局限性:仅能处理步骤固定且无异常的流程,对页面改版、弹窗等意外事件脆弱,且存在隐私问题。整体而言,这是一篇结合了产品评测、技术原理分析和冷静吐槽的科技分析文章,适合对 AI Agent、自动化办公或 OpenAI 产品感兴趣的深度读者。原文 ↗

核心观点
  • Codex 的新功能「Record & Replay」的核心价值在于跳过繁琐的 prompt 编写,通过用户演示来教会 AI 执行重复性桌面操作,且 AI 理解的是操作逻辑而非像素坐标,这是其与传统录宏软件的本质区别。
  1. 01Codex 的周活跃用户从年初的约 75 万增长至月活 500 万,半年增长近七倍,其中五分之一为非程序员,证明其市场需求旺盛且已破圈。
  2. 02录制完成后生成的 SKILL.md 文件是一个跨平台的操作说明书标准,不仅 Codex 能读,Claude 等 AI 工具也能使用,具备可共享和可编辑的特点。
  3. 03官方演示中,Codex 在上传 YouTube 视频的复杂流程中能自动匹配同名 .mp4 与 .srt 文件,并根据标题判断隐私设置,展示了其理解上下文逻辑的能力。
  4. 04作者将 Record & Replay 与传统的录宏进行对比:录宏记录的是死板像素坐标(如点击 (300,200)),而 Codex 记录的是语义动作(如选择「差旅费」科目),因此对 UI 改版有更强的鲁棒性。
  5. 05Record & Replay 依赖 Computer Use 技术,即 AI 通过识别屏幕上的按钮来操作,这导致其天然不稳定,易受页面改版、加载卡顿、弹窗广告等因素影响。
  6. 06该功能目前仅为 Mac 专属,Windows 用户无法使用,且因 GDPR 合规问题,欧洲用户也被限制。
反方 / 局限
  • 一个明显的局限性是,用户录制的是「顺利的那一遍」,而现实世界充满意外(如验证码弹出、日期格式错误、审批人离职),Codex 未学习如何处理这些异常。
  • 录制过程中,屏幕上的一切(包括可能误开的微信聊天窗口)都会被 AI 记录,存在显著的隐私泄露风险。OpenAI 自身也建议不要录密码和私密数据。
  • 生成的技能质量取决于用户的演示水平。如果用户操作本身不规范或随意,生成的 skill 也同样靠不住,存在「学了坏习惯」的风险。
CodexOpenAIRecord & ReplayComputer UseSKILL.mdClaudeHQL
8 分钟 · 4 卡片 · 9 资料
读原文 →

前置背景

平行视角

未来推演

延伸追问