余承东宣布华为盘古大模型剑指全球第一

6.6

深览指数

热点智搜·3小时前·AI 生成

余承东宣布华为盘古大模型剑指全球第一

余承东在 HDC 2026 上为盘古大模型定下从中国第一到全球第一的目标。文章披露了华为因算力受限转向提升时延/吞吐率的战略取舍，并详细介绍了开源盘古 2.0 的技术架构（505B/92B 参数、28:1 稀疏比、512k 上下文）、性能优势（推理吞吐率 2 倍于主流开源模型）以及与鸿蒙 Agent 的深度融合。文章核心价值在于揭示了华为在异构算力（昇腾生态）下的独特技术路线——用极端稀疏化与系统工程能力弥补算力短板。

核心观点

▍华为盘古大模型的核心战略是从国内第一冲击全球第一，其独特路径是在算力受限的条件下，通过极端稀疏化架构（28:1 稀疏比）和系统工程能力，在时延与吞吐率上超越对手，而非单纯堆参数规模。

01OpenPangu 2.0 Pro 总参数量 505B，激活参数仅 18B；Flash 版本总参数量 92B，激活参数 6B。28:1 的激进稀疏比大幅降低对昇腾算力的负载。
02在性能上，该模型支持 512k 超长上下文窗口，单卡推理吞吐率是业界主流开源模型的 2 倍。
03华为战略重心放在时延和吞吐率优化，原因是算力（“留的卡”）有限，且需优先支持国内其他企业需求，AI 算力成本高昂。
04华为宣布自 2026 年 6 月 30 日起，将陆续分批开放预训练、后训练代码及训练算子等 7 大核心组件，以降低开发者门槛，共建昇腾 AI 生态底座。
05OpenPangu 2.0 深度集成到 HarmonyOS 7 的智能体（Agent）任务中，在速度、精度和资源消耗上具优势。
06余承东承认因种种原因盘古大模型未能成为全球最佳，且去年国庆前夕才重新接手，立下军令状。

反方 / 局限

— 文章未提及盘古大模型在通用性、多模态能力或学术基准排名上与海外领先模型（如 GPT-5、Gemini）的具体差距，也未讨论 28:1 稀疏比可能带来的知识丢失或推理能力下降的潜在风险。
— 面对 AI 人才竞争，余承东坦言华为无法提供“亿级年收入”的薪资，而依赖“有梦想的人”，这在不考虑股权激励的情况下，对顶尖人才的长期吸引策略不够透明。

余承东华为盘古大模型OpenPangu 2.0HarmonyOS 7昇腾HDC 2026华为

2 分钟 · 5 卡片 · 12 资料

读原文 →读原文 →

余承东宣布华为盘古大模型剑指全球第一

前置背景

技术原理

平行视角

未来推演

延伸追问