6.6
深览指数
热点智搜··AI 生成

余承东宣布华为盘古大模型剑指全球第一

余承东在 HDC 2026 上为盘古大模型定下从中国第一到全球第一的目标。文章披露了华为因算力受限转向提升时延/吞吐率的战略取舍,并详细介绍了开源盘古 2.0 的技术架构(505B/92B 参数、28:1 稀疏比、512k 上下文)、性能优势(推理吞吐率 2 倍于主流开源模型)以及与鸿蒙 Agent 的深度融合。文章核心价值在于揭示了华为在异构算力(昇腾生态)下的独特技术路线——用极端稀疏化与系统工程能力弥补算力短板。

核心观点
  • 华为盘古大模型的核心战略是从国内第一冲击全球第一,其独特路径是在算力受限的条件下,通过极端稀疏化架构(28:1 稀疏比)和系统工程能力,在时延与吞吐率上超越对手,而非单纯堆参数规模。
  1. 01OpenPangu 2.0 Pro 总参数量 505B,激活参数仅 18B;Flash 版本总参数量 92B,激活参数 6B。28:1 的激进稀疏比大幅降低对昇腾算力的负载。
  2. 02在性能上,该模型支持 512k 超长上下文窗口,单卡推理吞吐率是业界主流开源模型的 2 倍。
  3. 03华为战略重心放在时延和吞吐率优化,原因是算力(“留的卡”)有限,且需优先支持国内其他企业需求,AI 算力成本高昂。
  4. 04华为宣布自 2026 年 6 月 30 日起,将陆续分批开放预训练、后训练代码及训练算子等 7 大核心组件,以降低开发者门槛,共建昇腾 AI 生态底座。
  5. 05OpenPangu 2.0 深度集成到 HarmonyOS 7 的智能体(Agent)任务中,在速度、精度和资源消耗上具优势。
  6. 06余承东承认因种种原因盘古大模型未能成为全球最佳,且去年国庆前夕才重新接手,立下军令状。
反方 / 局限
  • 文章未提及盘古大模型在通用性、多模态能力或学术基准排名上与海外领先模型(如 GPT-5、Gemini)的具体差距,也未讨论 28:1 稀疏比可能带来的知识丢失或推理能力下降的潜在风险。
  • 面对 AI 人才竞争,余承东坦言华为无法提供“亿级年收入”的薪资,而依赖“有梦想的人”,这在不考虑股权激励的情况下,对顶尖人才的长期吸引策略不够透明。
余承东华为盘古大模型OpenPangu 2.0HarmonyOS 7昇腾HDC 2026华为
2 分钟 · 5 卡片 · 12 资料
读原文 →

前置背景

技术原理

平行视角

未来推演

延伸追问