6.6
深览指数
科技微博·极客公园··AI 生成
OpenAI,开始造芯片了
OpenAI 与 Broadcom 联合宣布,历时九个月流片(tape-out),成功制造了名为「Jalapeño」的推理专用芯片。该芯片定位为 LLM 优化的推理加速器,据称单位功耗性能明显优于当前最先进硬件,成本可降低约 50%。文章分析了 OpenAI 作为自研芯片的后来者,选择从推理侧而非训练侧突破的战略逻辑,并通过与 Google TPU、Amazon Inferentia 的对比,指出了其在软件生态和量产能力上的长期挑战。适合关注 AI 基础设施、芯片产业、以及 OpenAI 商业化的读者阅读。原文 ↗
核心观点
- ▍OpenAI 自研芯片 Jalapeño 的战略核心是控制推理成本,为盈利铺路,并回应资本市场对 IPO 的期待。
- ▍Jalapeño 是一款「推理芯片」,而非「训练芯片」,这一定位是 OpenAI 在当前英伟达在训练市场结构性优势下的务实突破口。
- 01Jalapeño 从设计到流片仅用时九个月,大幅压缩了行业常规两到三年的周期,部分归功于 OpenAI 用自家模型辅助了芯片设计(EDA)流程。
- 02Broadcom CEO 声称,与典型 AI GPU 相比,Jalapeño 的成本可降低约 50%;但第三方基准测试和对比细节均未公开。
- 03OpenAI 与 Broadcom 合作,而非独立设计,因为 Broadcom 是全球最大的定制 ASIC 合作方之一(如谷歌 TPU 即由其量产),这是短期内拿到可用产品的最优路径。
- 04Jalapeño 专注于针对 Transformer 架构的注意力机制做专门优化,以在内存带宽和访存模式上与 GPT 系列模型深度匹配。
- 05计划 2026 年底前开始初步部署,说明芯片仍处于验证阶段,距大规模量产尚远。
- 06OpenAI 近期密集布局基础设施与企业市场动作:扩大企业网络、推出顾问认证项目、收购咨询公司 Tomoro、招募人才(如 Noam Shazeer)。
- 07与同行对比,OpenAI 是明显的后来者:谷歌 TPU 始于 2015,亚马逊 Inferentia 发布于 2019,微软 Azure Maia 发布于 2023。
反方 / 局限
- — 第三方基准测试和与哪款芯片对比的具体信息缺失,性能与成本优势尚无独立验证,Tom's Hardware 已对此提出质疑。
- — 芯片从流片到大规模量产,良率、供应链、软件生态(尤其是 CUDA 生态迁移成本)是重大挑战,谷歌和亚马逊都用了近十年迭代才成熟。
OpenAIBroadcomJalapeño英伟达Hock TanGreg BrockmanNoam ShazeerGoogle TPUAmazon InferentiaAzure MaiaCUDATomoro
5 分钟 · 4 卡片 · 12 资料
读原文 →