8.2
深览指数
科技腾讯新闻·高飞的电子替身··AI 生成

GPU算力为什么不是大宗商品?Neo Cloud公司有何竞争壁垒?

Lambda 联合创始人 Stephen Balaban 在播客中从底层物理到上层金融,深入剖析了 GPU 算力为何不会被商品化。核心论证是:云计算是高度垂直整合的复杂服务,而大多数 Neo Cloud 连真正的云服务都跑不起来。文章提供了反直觉的事实——2023 年部署的 H100 在 2026 年租金更高——并解释了这是结构性的供需与资产价值认知错位。适合关注 AI 基础设施投资与云服务行业竞争格局的深度读者,其中的论证链条对理解产业终局有参考价值。原文 ↗

核心观点
  • GPU 算力不会像预期那样被商品化,因为云服务是横跨土地权益、建筑施工、高性能计算和上层软件的垂直整合业务,而不是单纯的芯片转售。
  • Stephen Balaban 的核心论点是:云计算从来都不是一种商品服务,而是一项高度垂直整合的复杂服务。
  1. 01Lambda 2023 年部署的 H100,在 2026 年的租赁费率不仅没降,反而高于 2023 年,直接否定了 GPU 快速贬值的市场预期。
  2. 02SemiAnalysis 2026 年 4 月数据显示,H100 一年期合约价格从 2025 年 10 月的每小时 1.70 美元涨至 2026 年 3 月的 2.35 美元,涨幅约 40%。
  3. 03一个 GW 级 AI 设施的总投资接近 500 亿美元,其中服务器占绝对大头,服务器物料清单中 GPU 是最大成本项,且 HBM 内存价格也在大幅上涨。
  4. 04要构建一个可分区、保持高性能互联的裸金属云环境,所需的软件投入在几亿到上十亿美元量级,大多数 Neo Cloud 没有做过这种投入。
  5. 05Lambda 的核心产品 One-Click Cluster 需要同时分割 in-band 网络、compute fabric 和 out-of-band 监控网络三层,同时还要求支持 RDMA,这在 Neo Cloud 空间里几乎独一无二。
  6. 06Lambda 的前身 Dreamscope 月账单飙到 4 万美元后,花 6 万美元自建工作站集群,一个半月即回本,节省的钱比赚的钱还多,这直接促使其转型为计算能力供应商。
  7. 07行业核心瓶颈不在于 GPU 本身,而在于已拿到政府审批且绑定电力承诺的'已就绪土地'(entitled land)、充足的电力承诺,以及数据中心建筑外壳(MEP 设备)。
  8. 08cuDNN 和 NCCL 是 Nvidia 真正的护城河,它们是深度优化的矩阵乘法引擎和网络通信库,远非 CUDA 本身可比。
反方 / 局限
  • Stephen 承认,若 Scaling Law 失效,其整个关于算力需求无上限的推论将崩塌。但他坚信看不到其尽头。
  • 文章指出,长期 off-take 协议的融资模式(通过 SPV 做资产支持贷款)比按需云业务的融资更成熟,暗示按需云的商业模式在金融可行性上尚有不确定性。
  • 文中隐含的前提是,所有分析基于美国市场与 Nvidia 生态,未深度讨论 AMD、谷歌 TPU、国产芯片等替代路径对 Neo Cloud 竞争格局的可能冲击。
Stephen BalabanLambdaNeo CloudNvidiaCUDAcuDNNNCCLH100Silicon DataSemiAnalysisMichel CombesTWG GlobalScaling LawHBMPUEFLOPSOpenMPIRDMABMCDPUOne-Click ClusterNeural SoftwarePositron AIxAIAlexNetPerceptioAppleMatt TurckFirstMark
25 分钟 · 3 卡片 · 5 资料
读原文 →

前置背景

平行视角

未来推演