7.3
深览指数
商业腾讯新闻·钛媒体APP··AI 生成

GPT设计GPT

OpenAI首款推理芯片Jalapeño问世,关键意义不在于挑战英伟达,而是OpenAI首次公开承认自己不再只做模型公司,要控制从模型到芯片、数据中心到能源的整个智能生产链条。作者认为模型差距正在缩小,而计算成本差距在扩大,OpenAI正通过自研芯片削减推理税、构建类似苹果的软硬闭环。文章适合关注AI产业战略、芯片竞争与商业模式变化的从业者阅读。原文 ↗

核心观点
  • OpenAI首款芯片Jalapeño的意义不在挑战英伟达,而在于宣告OpenAI要从一家模型公司转型为控制智能生产全链条(模型、芯片、数据中心、能源)的公司。
  • 模型领先窗口正在变短,真正拉开长期差距的因素开始转向算力供应、推理成本、系统效率等底层能力,而非单纯的模型参数和榜单。
  1. 01Jalapeño从流片到完成仅九个月,而传统高性能ASIC周期通常为18-36个月,OpenAI通过博通、Celestica等合作伙伴压缩了周期。
  2. 02OpenAI在官方新闻稿中明确表示,使用自己的模型加速了部分芯片设计和优化流程,且提供给用户的模型也在帮助改进运行未来模型的基础设施。
  3. 03Jalapeño面向大语言模型推理而非训练,目标是降低推理成本和Token的生产成本;OpenAI引述英伟达黄仁勋观点称,关键是生成成本最低的Token,而非采购价最低的硬件。
  4. 04OpenAI用户越多、产品越成功,英伟达的算力税就越重;ChatGPT每天处理海量请求,未来Agent、视频生成、长推理链将进一步推高Token消耗。
  5. 05Google(TPU)、亚马逊(Trainium/Inferentia)、Meta、微软均已走通自研ASIC路线的经济逻辑;OpenAI具备真实请求、产品路线、模型团队和博通等产业伙伴来支撑自研。
  6. 06文章将OpenAI的战略类比苹果:芯片为系统优化,系统为应用优化,应用体验反哺芯片迭代,形成闭环;OpenAI CEO Altman近年反复谈及芯片、能源、核聚变、数据中心。
反方 / 局限
  • 短期看,OpenAI仍离不开英伟达的训练和通用计算GPU平台;Jalapeño不可能很快覆盖全部负载,大概率先进入最确定的推理场景。
7 分钟 · 4 卡片 · 9 资料
读原文 →

前置背景

平行视角

未来推演

延伸追问