8.4
深览指数
科技Bestblogs·腾讯科技··AI 生成
AI 不会合作?那是因为他们没见过市场经济|Hao 好聊趋势
本文论证当前 LLM 因训练范式(单体MDP)而天生缺乏合作能力,形成唯我论认知架构,能力越强的模型反而合作越差。接着将编排式多Agent架构批判类比为‘计划经济’,提出以拍卖、信用分配、经济自然选择等市场机制替代中央编排,并引用哈佛MIT论文《Economy of Minds》证明市场系统可超越单Agent与编排系统。文章提供了一个从‘设计合作结果’到‘设计合作条件’的范式转移视角,适合对AI Agent架构设计、博弈论、计算经济学感兴趣的深度读者阅读。
核心观点
- ▍当前LLM因训练范式(MDP)而天生缺乏合作能力,形成‘唯我论’认知架构,能力越强合作越差。
- ▍多Agent系统的出路在于‘设计合作条件’而非‘设计合作结果’,市场机制可让合作在自利行为中涌现。
- 012026年多篇研究(北卡、UIUC、斯坦福、Google DeepMind)揭示多Agent系统失败率高达41%-87%,核心原因是协调崩溃与趋同推理。
- 02能力越强的模型(如o3)合作能力越差,因为当前训练是单人游戏(MDP),从未面对过真正的他者。
- 03编排式架构(Orchestrator-Worker)面临分工悖论:编排者需懂所有子任务才能有效分派,但达到全知后已无分工必要。
- 04编排式架构面临信用分配失灵:Agent完成子任务的好坏无法准确归因到个体,导致‘干多干少一个样’。
- 05编排式架构受到‘哈耶克知识分散诅咒’:中央编排者无法完整收集分散在Agent中的私有知识,编排本身消耗算力而无信息增益。
- 06哈佛与MIT论文《Economy of Minds》设计无编排的自由市场系统,通过拍卖、桶旅式信用分配、经济自然选择与新手保护四个机制让合作涌现。
- 07该市场系统在MATH、HumanEval、ALFWorld等基准上显著超越单Agent与编排式系统。
- 08该论文从理论上证明市场机制可渐近达到全知编排者的最优配置。
- 09专才Agent在市场中因赢得拍卖积累财富被克隆而自然胜出,通才因能力摊薄破产淘汰,形成专业化分工。
反方 / 局限
- — 该方向目前存在简化局限:仅支持文字任务,未集成视觉等跨模态能力,且拍卖机制本身并非零延迟通信,大规模部署仍有工程瓶颈。
MDPOrchestrator-Worker架构市场机制Economy of Minds哈耶克知识分散诅咒北卡大学UIUC斯坦福Google DeepMind哈佛MIT
4 分钟 · 5 卡片 · 12 资料
读原文 →