6.8
深览指数
科技微博·红衣大叔周鸿祎··AI 生成

国产AI最难一关过了

本文报道了国内联合攻关团队使用华为昇腾910C算力集群,完成1.6万亿参数DeepSeek V4 Pro全参数后训练的消息。作者周鸿祎认为,这标志着中国AI产业从‘能用模型’跨越到‘能训练模型’,并强调了全参数训练、系统工程能力、人才培养的重要性。文章的核心价值在于指出了国产AI产业在硬件受限下,通过工程突破获得自主训练能力的里程碑意义,适合关心国产芯片、AI算力产业链及科技自主可控议题的读者阅读。

核心观点
  • 国内联合攻关团队用华为昇腾910C算力集群完成1.6万亿参数DeepSeek V4 Pro的全参数后训练,证明中国AI已从推理端跨越到训练端,开始拥有自主的AI底座能力。
  • 这一突破的核心价值不是单卡性能领先,而是系统工程能力的验证:通过集群调度、精确分拆显存、任务排班、训练稳定性监控,在国产算力上跑出了工业级效率。
  1. 01DeepSeek V4 Pro采用混合专家模型,训练时的专家间数据交换量是普通模型的几十倍,对计算、存储、通信、调度、容错提出了极高要求。
  2. 02项目团队实现了1500多步训练全程无中断,算力利用率超过30%,这在万亿级参数模型训练中是工业级效率的体现。
  3. 03三个具体的工程突破:1)显存像拼图一样拆,把1.6万亿参数精确分配到每一张芯片;2)任务像排班一样调,防止部分专家资源闲置或过载;3)训练像守夜一样盯,防止中途崩溃浪费算力。
  4. 04作者认为这件事最被低估的价值是人才培养:项目让青年工程师和学生真实跑过万亿级模型训练流程,这些‘打过硬仗’的人是国产AI未来的核心资产。
  5. 05此次攻关发生在美国持续收紧AI芯片和算力限制的背景下,解决了过去认为‘没有海外高端芯片就只能做推理、做不了复杂训练’的认知瓶颈。
反方 / 局限
  • 作者明确承认‘这次事件不说明国产芯片突然全面领先了’,指出国内AI仍面临生态不完善、工程经验不足等短板,尚处于‘靠项目补课’的阶段。
  • 文章暗示了长期关注点的不确定性:下一步是把国产算力用于长文本、行业模型、智能体等场景,但并未深入讨论这些场景落地的具体困难和成本。
周鸿祎华为DeepSeekDeepSeek V4 Pro昇腾910C混合专家模型全参数训练美国AI芯片限制
4 分钟 · 3 卡片 · 9 资料
读原文 →

前置背景

平行视角

延伸追问