智谱的GLM-5.2，中国开源模型的“好用”时刻吗

6.8

深览指数

科技腾讯新闻·6小时前·AI 生成

智谱的GLM-5.2，中国开源模型的“好用”时刻吗

智谱开源模型GLM-5.2发布，定价仅为Claude Opus约五分之一，且开放权重，专注于长程智能体任务。文章以智谱与Anthropic的对比为线索，指出中国开源模型已全面超越美国开源模型，但在实际收入与“有用性”上差距显著。作者核心贡献在于提出中国模型正从“打榜学霸”转向“好用智能体”，并详细解析了智谱自研的slime后训练框架及其OPD技术，认为这可能是打破美国禁运的关键。适合关注AI产业竞争、开源模型技术路线及中美科技博弈的深度读者。原文 ↗原文 ↗

核心观点

▍中国开源模型正从“打榜学霸”跃升为“好用智能体”，智谱GLM-5.2是这一转折的标志性产品。
▍美国政府对前沿模型的出口禁令和中国AI供应链的封锁，反而为中国开源模型创造了“从可选变必选”的战略机遇。

01GLM-5.2在长程智能体任务基准测试中达到Claude Opus 4.7-4.8水平，但价格仅为后者约五分之一。
02马斯克在X上回应唐杰时指出，Anthropic的模型优势体现在“有用性”带来的收入上，而非打榜成绩，暗示GLM在实用性上仍有差距。
03智谱自研的slime后训练框架，通过训推分离（Megatron-LM + SGLang），支撑了GLM-5.2的大规模智能体强化学习训练。
04slime框架已适配华为昇腾NPU（slime-ascend），并支持主流国产开源模型（Qwen3、GLM-4.7等），显示出与国产硬件生态的融合。
05智谱使用OPD（在线策略蒸馏）技术，如在两天内完成强化学习训练，并训练了十余个专家模型并合并到最终模型（暗示含网络安全专家）。
06Anthropic发布的Mythos Preview模型在网络安全领域展现“代际级”跃升，因“双刃剑”特性引发担忧，智谱被认为在年底可能达到同一水平。

反方 / 局限

— 文章承认中国开源模型在实际收入和对用户的“有用性”上，与美国头部公司（如Anthropic）差距明显，智谱收入仅为对方零头。
— 尽管GLM-5.2在基准测试中追平Claude，但马斯克强调“有用性”才是衡量标准，中国模型的真实落地场景和用户价值尚未得到充分验证。

智谱AIGLM-5.2slimeOPD（在线策略蒸馏）AnthropicClaude Opus 4.8Mythos Preview唐杰马斯克华为昇腾Megatron-LMSGLang

7 分钟 · 3 卡片 · 8 资料

读原文 →

智谱的GLM-5.2，中国开源模型的“好用”时刻吗

前置背景

平行视角

未来推演