7.3
深览指数
科技虎嗅·经济观察报··AI 生成

AI算力变局:TPU正成为“另一个选项”

随着AI推理需求增速远超训练,专为深度学习设计的谷歌TPU在集群效率和性价比上优势凸显,正从配角走向台前。文章通过对比GPU与TPU的架构根源,论证了未来AI芯片市场将形成442格局(ASIC、DSA、GPU各占相应份额),并指出TPU并非替代GPU,而是在特定场景下的更优选择。适合关注AI基础设施、芯片产业和云服务投资的人阅读。原文 ↗

核心观点
  • AI算力需求正从训练转向推理,这一结构性变化使专为AI设计的TPU(Google张量处理器)成为GPU之外的重要选项,并有望改变AI芯片市场格局。
  • 未来AI芯片市场将形成442格局:40%为极致性价比的纯ASIC芯片,40%为可编程的DSA芯片(如TPU),20%为通用GPU(留给快速变化的算法研究)。
  1. 01国家数据局数据显示,2025年中国AI推理数据量首次超过训练数据量。TrendForce预测2026年北美云商推理算力将暴增122%,增速是训练的两倍以上。
  2. 02TPU的集群优势:GPU跨机架大规模集群需额外采购高速交换设备;而TPU机柜内芯片可直接互通,跨机柜使用自研光电路交换机,整体部署硬件成本更低。
  3. 03TPU芯片剔除了图形渲染等无关功能,聚焦深度学习矩阵运算。杨龚轶凡指出,在同等生产工艺下,谷歌TPU对比GPU有3到5倍的性能提升。
  4. 04TPU的软件生态优势:开发者使用PyTorch等主流框架即可,硬件指令由编译器自动优化;而CUDA更像一套“修车工具”,开发者需理解硬件底层逻辑。
  5. 05GPU设计源自3D游戏图形渲染,内部有上万个并行计算核心,适合高并发但控制逻辑复杂;TPU更适合深度学习层间有顺序的流水线式计算。
反方 / 局限
  • TPU并非对GPU构成替代关系:20%的GPU市场会长期存在,因为AI新算法、新方向不断涌现,CUDA生态经过20年打磨,仍是快速验证想法的最灵活平台。
  • TPU的适应性局限:纯ASIC芯片(442格局中占比40%的部分)只能跑固定一两个模型的推理,虽然性价比极致但灵活度更低。
Google TPUGPUASICDSACUDAPyTorch中昊芯英杨龚轶凡TrendForce集邦咨询国家数据局
6 分钟 · 5 卡片 · 12 资料
读原文 →

前置背景

平行视角

争议局限

未来推演

延伸追问