国产AI最难一关过了

6.8

深览指数

科技微博·红衣大叔周鸿祎·11小时前·AI 生成

国产AI最难一关过了

本文报道了国内联合攻关团队使用华为昇腾910C算力集群，完成1.6万亿参数DeepSeek V4 Pro全参数后训练的消息。作者周鸿祎认为，这标志着中国AI产业从‘能用模型’跨越到‘能训练模型’，并强调了全参数训练、系统工程能力、人才培养的重要性。文章的核心价值在于指出了国产AI产业在硬件受限下，通过工程突破获得自主训练能力的里程碑意义，适合关心国产芯片、AI算力产业链及科技自主可控议题的读者阅读。

核心观点

▍国内联合攻关团队用华为昇腾910C算力集群完成1.6万亿参数DeepSeek V4 Pro的全参数后训练，证明中国AI已从推理端跨越到训练端，开始拥有自主的AI底座能力。
▍这一突破的核心价值不是单卡性能领先，而是系统工程能力的验证：通过集群调度、精确分拆显存、任务排班、训练稳定性监控，在国产算力上跑出了工业级效率。

01DeepSeek V4 Pro采用混合专家模型，训练时的专家间数据交换量是普通模型的几十倍，对计算、存储、通信、调度、容错提出了极高要求。
02项目团队实现了1500多步训练全程无中断，算力利用率超过30%，这在万亿级参数模型训练中是工业级效率的体现。
03三个具体的工程突破：1）显存像拼图一样拆，把1.6万亿参数精确分配到每一张芯片；2）任务像排班一样调，防止部分专家资源闲置或过载；3）训练像守夜一样盯，防止中途崩溃浪费算力。
04作者认为这件事最被低估的价值是人才培养：项目让青年工程师和学生真实跑过万亿级模型训练流程，这些‘打过硬仗’的人是国产AI未来的核心资产。
05此次攻关发生在美国持续收紧AI芯片和算力限制的背景下，解决了过去认为‘没有海外高端芯片就只能做推理、做不了复杂训练’的认知瓶颈。

反方 / 局限

— 作者明确承认‘这次事件不说明国产芯片突然全面领先了’，指出国内AI仍面临生态不完善、工程经验不足等短板，尚处于‘靠项目补课’的阶段。
— 文章暗示了长期关注点的不确定性：下一步是把国产算力用于长文本、行业模型、智能体等场景，但并未深入讨论这些场景落地的具体困难和成本。

周鸿祎华为DeepSeekDeepSeek V4 Pro昇腾910C混合专家模型全参数训练美国AI芯片限制

4 分钟 · 3 卡片 · 9 资料

读原文 →

国产AI最难一关过了

前置背景

平行视角

延伸追问