热点智搜··AI 生成
华为重启盘古大模型发布OpenPangu 2.0开源架构
华为在2026年HDC大会上宣布由余承东亲自挂帅盘古大模型,发布OpenPangu 2.0开源架构,目标是冲击世界第一。文章核心信息包括:放弃参数内卷,转向算力效率优先的MoE架构;全链路开源以降低昇腾生态适配门槛;深度融入鸿蒙系统并规划端侧模型。同时,文章也承认了算力受限、历史代码争议及C端存在感薄弱等挑战。适合关注国产大模型技术路线、AI芯片生态及华为战略动向的读者快速把握全局。原文 ↗原文 ↗
核心观点
- ▍华为盘古大模型重启的战略核心是放弃参数内卷,转向以昇腾算力为基础的算力效率优先路线,并通过全栈开源构建生态护城河。
- 01OpenPangu 2.0采用MoE稀疏架构:Pro版505B总参数仅激活18B,稀疏比28:1;Flash版92B总参数仅激活6B,兼顾性能与成本。
- 02全系原生支持512K token超长上下文,可一次性处理相当于8本《三体》的文本量,且显存占用与计算量增长平缓。
- 03针对昇腾NPU进行深度优化,单卡推理吞吐率可达业界主流开源模型的2倍,显著降低部署成本。
- 04华为宣布从2026年6月30日起分批开源预训练代码、后训练代码等7大核心组件,为国产大模型中开源力度最大。
- 05盘古大模型深度集成至HarmonyOS 7智能体框架,执行跨应用调度等复杂Agent任务成功率提升至90%以上。
- 06计划2026年秋季推出30B参数的端侧盘古模型,适配麒麟芯片,实现离线运行且吞吐率提升5倍。
- 07在B端垂直行业,气象大模型成果曾登上《Nature》,在台风预测中大幅超越传统超算;在矿山、电网等落地超500个场景。
反方 / 局限
- — 华为自留昇腾算力相对有限,因需优先支持国内其他企业产业需求,短期内不具备训练万亿级以上超大参数模型的条件。
- — 2025年曾卷入开源代码与竞品高度相似的争议,虽华为回应称有创新,但重建行业完全信任仍需时间。
- — 在普通消费者常用的通用对话、创意写作等场景中,盘古的知名度和体验感落后于部分国产互联网大模型,需依赖鸿蒙终端普及突围。
盘古大模型OpenPangu 2.0华为余承东昇腾鸿蒙OSMoE稀疏架构
前置背景
应用场景
平行视角
争议局限
未来推演