Hermes新功能上线！比Opus 4.8和GPT-5.5还猛

5.7

深览指数

科技智东西·毕伟豪·2小时前·AI 生成

Hermes新功能上线！比Opus 4.8和GPT-5.5还猛

Nous Research 旗下 Hermes Agent 上线 MoA（Mixture of Agents）功能，允许用户自由组合多个开源模型，在内部基准测试中评分超过闭源顶尖模型 Opus 4.8 和 GPT-5.5。文章通过实际案例（游戏生成、仪表盘生成）对比展示了 MoA 模式相比单一模型在输出质量上的显著提升，但也指出其推理成本和时间代价。文章核心观点是，大模型竞争正从「寻找最强单一模型」转向「通过多模型编排协作」的 Agent 范式，适合关注 AI 应用与系统架构的从业者阅读。原文 ↗原文 ↗

核心观点

▍大模型竞争已从「追求最强单一模型」转向「通过编排多模型协作（Agent 模式）」这一新范式。
▍MoA 的核心是用开源模型组合达到顶尖闭源模型水准，让擅长规划/推理的模型负责思考，让擅长执行/实践的模型负责落地。

01Nous Research 内部基准测试显示，MoA 模式评分超过 Opus 4.8 和 GPT-5.5。
02海外博主实测：使用 kimi-k2.6 和 minimax-m3 作参考模型、glm-5.2 作聚合模型生成游戏，效果（流畅度、关卡合理性）明显优于单一 glm-5.2 模型，但耗时从 13 分钟增至 35 分钟，成本从 0.38 美元升至 0.47 美元。
03另一实测：使用三个 grok 模型作参考、GPT-5.5 作聚合模型生成交互仪表盘，生成速度反而快于单一 GPT-5.5 模型（推测因用了 grok 快速模型），且输出设计质感更强。
04MoA 技术源于 2024 年 6 月 Together AI 论文《Mixture-of-Agents Enhances Large Language Model Capabilities》，将模型分为「参考模型」（只生成意见，不用工具）和「聚合模型」（综合判断并执行任务）。
05日本 AI 独角兽 Sakana AI 发布的 Sakana Fugu 系列编排器模型与 MoA 思路相似，可根据任务选择最佳模型处理。

反方 / 局限

— MoA 模式需要承担更高的推理成本，部分任务耗时明显增加，并非所有场景都值得开启。

Nous Research Hermes Agent MoA (Mixture of Agents)Together AI Sakana AI Teknium Opus 4.8 GPT-5.5 glm-5.2 kimi-k2.6 minimax-m3 grok

10 分钟 · 4 卡片 · 12 资料

读原文 →

Hermes新功能上线！比Opus 4.8和GPT-5.5还猛

前置背景

平行视角

未来推演

延伸追问