5.7
深览指数
科技腾讯新闻·特大牛··AI 生成
中国存储这次露大脸了
文章报道中科曙光旗下分布式全闪存储系统 ParaStor F9000 在 2026 年 IO500 榜单中,同时拿下生产型全节点和 10 节点两项榜首,性能是第二名的两倍多。作者将登顶归因于存储角色重塑(从被动仓库到主动“喂数据”)、三级协同架构(芯片/硬件/应用)以及通过严苛的“生产型”IO500 测试三个层面。文章引自曙光官方宣传,意在强调国产存储在全球高性能计算和 AI 基础设施领域的关键能力跃升。适合关注国产替代、AI 基础设施(算力/存力)的技术决策者与产业观察者阅读,了解当前国产存储的标杆案例与技术路线。原文 ↗
核心观点
- ▍AI 训练效率瓶颈在于存储到 GPU 的“运输路径”(带宽、IO、时延),而非 GPU 算力本身。曙光存储通过让存力主动介入流水线、“喂数据”给 GPU 来解决。
- ▍国产存储正在从后台基础设施变成决定系统效率和计算上限的关键环节。
- 01中科曙光 ParaStor F9000 在 ISC 2026 大会公布的 IO500 榜单中,获得生产型全节点和 10 节点榜首,总得分 79,110.05,是第二名的两倍多,吞吐能力达 26888.39 GiB/s。
- 02曙光提出三级协同架构:芯片级(IB/RoCE、CPU、内存、NVMe 与 GPU 全对称均衡)、硬件级(驱动与底层硬件深度联动)、AI 应用级(数据直通 GPU 显存、KV Cache 加速等)。
- 03ParaStor F9000 宣称可提供从千卡到十万卡集群的整机柜交付方案,支持千亿参数大模型部署时间缩短 1 倍,集群训练效率提升 50%。
- 04IO500 生产型榜单仅纳入已在真实生产环境长期运行的存储系统,曙光的产品已支撑万卡级算力集群稳定运行超过一年,并应用于大模型训练与科学计算场景。
- 05曙光存储此前战绩:四年前获 IO500 10 节点榜单第一;FlashNexus 集中式全闪存储获 SPC-1 性能测试领先;联合龙讯旷腾完成 414.7 亿原子规模的液态水分子动力学模拟世界纪录。
反方 / 局限
- — 文章所有“证据”均来自曙光官方宣传口径,缺乏第三方独立评测、竞品对比数据可验证性。
- — “生产型”IO500 榜单的权威性、实际负载的代表性(测试基准能否真实反映 AI 训练/推理的复杂 I/O 模式)未在文中讨论。
- — 文中提及的 AI 效率提升 50%、部署时间缩短 1 倍等数据,未说明具体测试环境、对比基准,存在营销夸大的可能。
5 分钟 · 5 卡片 · 12 资料
读原文 →