6.8
深览指数
科技腾讯新闻··AI 生成
智谱的GLM-5.2,中国开源模型的“好用”时刻吗
智谱开源模型GLM-5.2发布,定价仅为Claude Opus约五分之一,且开放权重,专注于长程智能体任务。文章以智谱与Anthropic的对比为线索,指出中国开源模型已全面超越美国开源模型,但在实际收入与“有用性”上差距显著。作者核心贡献在于提出中国模型正从“打榜学霸”转向“好用智能体”,并详细解析了智谱自研的slime后训练框架及其OPD技术,认为这可能是打破美国禁运的关键。适合关注AI产业竞争、开源模型技术路线及中美科技博弈的深度读者。原文 ↗
核心观点
- ▍中国开源模型正从“打榜学霸”跃升为“好用智能体”,智谱GLM-5.2是这一转折的标志性产品。
- ▍美国政府对前沿模型的出口禁令和中国AI供应链的封锁,反而为中国开源模型创造了“从可选变必选”的战略机遇。
- 01GLM-5.2在长程智能体任务基准测试中达到Claude Opus 4.7-4.8水平,但价格仅为后者约五分之一。
- 02马斯克在X上回应唐杰时指出,Anthropic的模型优势体现在“有用性”带来的收入上,而非打榜成绩,暗示GLM在实用性上仍有差距。
- 03智谱自研的slime后训练框架,通过训推分离(Megatron-LM + SGLang),支撑了GLM-5.2的大规模智能体强化学习训练。
- 04slime框架已适配华为昇腾NPU(slime-ascend),并支持主流国产开源模型(Qwen3、GLM-4.7等),显示出与国产硬件生态的融合。
- 05智谱使用OPD(在线策略蒸馏)技术,如在两天内完成强化学习训练,并训练了十余个专家模型并合并到最终模型(暗示含网络安全专家)。
- 06Anthropic发布的Mythos Preview模型在网络安全领域展现“代际级”跃升,因“双刃剑”特性引发担忧,智谱被认为在年底可能达到同一水平。
反方 / 局限
- — 文章承认中国开源模型在实际收入和对用户的“有用性”上,与美国头部公司(如Anthropic)差距明显,智谱收入仅为对方零头。
- — 尽管GLM-5.2在基准测试中追平Claude,但马斯克强调“有用性”才是衡量标准,中国模型的真实落地场景和用户价值尚未得到充分验证。
智谱AIGLM-5.2slimeOPD(在线策略蒸馏)AnthropicClaude Opus 4.8Mythos Preview唐杰马斯克华为昇腾Megatron-LMSGLang
7 分钟 · 3 卡片 · 8 资料
读原文 →