科技Bestblogs·阿里云开发者··AI 生成
相比层出不穷的 Agent 框架,不变的 Agent Protocol 是什么
文章从协议视角拆解 Agent Runtime,提出六个跨框架的稳定对象(Thread、Run、Step、Event、Artifact、Checkpoint),并区分执行模型的两层结构:Loop 承载方式与编排协议模式。核心观点是框架 API 会变,任务生命周期管理、状态持久化、中断恢复等底层问题不变,理解协议边界比追逐新框架更重要。适合对 Agent 工程有一定认识的开发者,帮助穿透 API 变化看清本质。原文 ↗原文 ↗
核心观点
- ▍Agent Runtime 的核心不是模型调用,而是任务生命周期管理,围绕 Thread、Run、Step、Event、Artifact、Checkpoint 六个稳定对象展开。
- ▍执行模型应分两层理解:Loop 承载方式(图式/代码式/托管式)与编排协议模式(ReAct、Plan-and-Execute 等),两者不可混淆。
- 01文章定义了 Agent Protocol 的三个层次:具体协议标准(如 OpenAPI)、通用协议对象(Thread/Run/Step 等)、以及 Runtime 实现能力。
- 02Loop 承载方式有三种:图式(如 LangGraph,节点边在框架中显式建模)、代码式(如 OpenAI SDK,开发者用代码控制循环)、托管式(如 Claude Agent SDK,平台管理循环)。
- 03编排协议模式包括 ReAct、Plan-and-Execute、Conversation-style coordination,它们决定了循环内部哪些语义被显式建模为状态对象。
- 04Agent Harness(如 Deep Agents SDK)将 Runtime 能力打包成默认的长任务体验,提供规划、子智能体、文件系统、权限模型等开箱即用能力。
- 05文章对比了 LangGraph、OpenAI、AutoGen、Claude SDK 在 Thread 管理、状态持久化、中断恢复等维度的设计差异。
- 06真正区分玩具 Agent 和生产 Agent 的是状态持久化、中断恢复、可观测性和可评测性,对应 Checkpoint、Event、Trace 等协议对象。
- 07文章讨论了事件驱动 Runtime、Workspace/Sandbox 两个高级话题,前者强调异步事件模型,后者关注运行环境隔离。
反方 / 局限
- — 作者指出 Harness 的强封装意味着默认决策不一定适配所有场景,复杂场景下开发者需理解其决策并保留覆写能力。
- — 文中隐含的局限是协议标准化程度仍不足,不同框架对相同协议对象的命名和语义有差异,真正的跨框架互操作尚未实现。
概念锚点
前置背景
技术原理
平行视角
未来推演
延伸追问