5.7
深览指数
科技智东西·毕 伟豪··AI 生成
Hermes新功能上线!比Opus 4.8和GPT-5.5还猛
Nous Research 旗下 Hermes Agent 上线 MoA(Mixture of Agents)功能,允许用户自由组合多个开源模型,在内部基准测试中评分超过闭源顶尖模型 Opus 4.8 和 GPT-5.5。文章通过实际案例(游戏生成、仪表盘生成)对比展示了 MoA 模式相比单一模型在输出质量上的显著提升,但也指出其推理成本和时间代价。文章核心观点是,大模型竞争正从「寻找最强单一模型」转向「通过多模型编排协作」的 Agent 范式,适合关注 AI 应用与系统架构的从业者阅读。原文 ↗
核心观点
- ▍大模型竞争已从「追求最强单一模型」转向「通过编排多模型协作(Agent 模式)」这一新范式。
- ▍MoA 的核心是用开源模型组合达到顶尖闭源模型水准,让擅长规划/推理的模型负责思考,让擅长执行/实践的模型负责落地。
- 01Nous Research 内部基准测试显示,MoA 模式评分超过 Opus 4.8 和 GPT-5.5。
- 02海外博主实测:使用 kimi-k2.6 和 minimax-m3 作参考模型、glm-5.2 作聚合模型生成游戏,效果(流畅度、关卡合理性)明显优于单一 glm-5.2 模型,但耗时从 13 分钟增至 35 分钟,成本从 0.38 美元升至 0.47 美元。
- 03另一实测:使用三个 grok 模型作参考、GPT-5.5 作聚合模型生成交互仪表盘,生成速度反而快于单一 GPT-5.5 模型(推测因用了 grok 快速模型),且输出设计质感更强。
- 04MoA 技术源于 2024 年 6 月 Together AI 论文《Mixture-of-Agents Enhances Large Language Model Capabilities》,将模型分为「参考模型」(只生成意见,不用工具)和「聚合模型」(综合判断并执行任务)。
- 05日本 AI 独角兽 Sakana AI 发布的 Sakana Fugu 系列编排器模型与 MoA 思路相似,可根据任务选择最佳模型处理。
反方 / 局限
- — MoA 模式需要承担更高的推理成本,部分任务耗时明显增加,并非所有场景都值得开启。
Nous ResearchHermes AgentMoA (Mixture of Agents)Together AISakana AITekniumOpus 4.8GPT-5.5glm-5.2kimi-k2.6minimax-m3grok
10 分钟 · 4 卡片 · 12 资料
读原文 →