7.9
深览指数
科技Bestblogs·大淘宝技术··AI 生成
AI Agent 的 Skill 系统设计
本文系统阐述 AI Agent Skill 系统的设计理念与实战经验,核心在于将 Skill 定义为行为编程而非知识文档。作者基于淘宝技术团队的工程实践,提出了渐进式上下文的 Token 经济策略、按任务风险分级的自由度控制(从文本引导到脚本门控),以及使用流程图、检查表和门控标签将流程固化为可执行路径。文章强调 Agent 会在压力下找借口绕开规则,因此验证体系需包括基础验证、前向测试和对抗性合理化防御。适合正在构建 Agent 行为系统的工程师阅读,尤其对偏执于 Token 效率和防 Agent 作弊的读者极具价值。原文 ↗
核心观点
- ▍Skill 是行为编程而非文档,其核心任务是预设 Agent 的失败模式并引导其走正确路径,而非简单描述能力。
- ▍上下文窗口是公共资源,必须以 Token 经济思维进行精细化管理,Skill 应采用分层加载的渐进披露策略。
- 01Token 经济策略采用三层架构:元数据层(发现路由)、正文层(执行流程)、资源层(references/scripts/assets 按需读取),避免一次性占满上下文。
- 02风险控制分级:低风险用文本引导(原则指导),中等风险用模板(结构约束),高风险用确定性脚本(流程固化),关键路径使用 HARD-GATE 门控标签强制阻断非法操作。
- 03创建流程六步法:理解例子→规划资源→初始化→编辑→验证→迭代,强调从具体业务例子出发而非从抽象能力定义开始。
- 04验证体系包括三层:基础验证(语法/结构)、前向测试(子代理执行任务并比对结果,不泄露预期答案)、对抗合理化(预写 Agent 可能的借口并内置反驳)。
- 05文章给出了多种具体代码示例,包括使用反引号包裹 YAML 加载引用、用 HARD-GATE 标签强制阻断搜索外部链接等。
- 06交付前反模式自查表涵盖 7 条,包括:把 Token 当便宜货、描述写成教程、过度依赖提词技巧、不设门控、用一次性指令代替可复用 Skill 等。
反方 / 局限
- — 文章主要基于淘宝技术团队内部的大模型 Agent 实践,其门控标签、Token 经济策略等设计思路是否适用于不同厂商的模型(如 Claude、GPT-4、Gemini)的 Agent 行为差异,文中未做跨模型验证。
- — 强调用代码/脚本强制约束 Agent 行为,但未充分讨论模型自身对齐能力差异:如果底层模型本身安全意识薄弱或容易被 prompt 注入,这套工程约束能否真正兜底?
4 分钟 · 4 卡片 · 6 资料
读原文 →