GPT设计GPT

7.3

深览指数

商业腾讯新闻·钛媒体APP·5小时前·AI 生成

GPT设计GPT

OpenAI首款推理芯片Jalapeño问世，关键意义不在于挑战英伟达，而是OpenAI首次公开承认自己不再只做模型公司，要控制从模型到芯片、数据中心到能源的整个智能生产链条。作者认为模型差距正在缩小，而计算成本差距在扩大，OpenAI正通过自研芯片削减推理税、构建类似苹果的软硬闭环。文章适合关注AI产业战略、芯片竞争与商业模式变化的从业者阅读。原文 ↗原文 ↗

核心观点

▍OpenAI首款芯片Jalapeño的意义不在挑战英伟达，而在于宣告OpenAI要从一家模型公司转型为控制智能生产全链条（模型、芯片、数据中心、能源）的公司。
▍模型领先窗口正在变短，真正拉开长期差距的因素开始转向算力供应、推理成本、系统效率等底层能力，而非单纯的模型参数和榜单。

01Jalapeño从流片到完成仅九个月，而传统高性能ASIC周期通常为18-36个月，OpenAI通过博通、Celestica等合作伙伴压缩了周期。
02OpenAI在官方新闻稿中明确表示，使用自己的模型加速了部分芯片设计和优化流程，且提供给用户的模型也在帮助改进运行未来模型的基础设施。
03Jalapeño面向大语言模型推理而非训练，目标是降低推理成本和Token的生产成本；OpenAI引述英伟达黄仁勋观点称，关键是生成成本最低的Token，而非采购价最低的硬件。
04OpenAI用户越多、产品越成功，英伟达的算力税就越重；ChatGPT每天处理海量请求，未来Agent、视频生成、长推理链将进一步推高Token消耗。
05Google（TPU）、亚马逊（Trainium/Inferentia）、Meta、微软均已走通自研ASIC路线的经济逻辑；OpenAI具备真实请求、产品路线、模型团队和博通等产业伙伴来支撑自研。
06文章将OpenAI的战略类比苹果：芯片为系统优化，系统为应用优化，应用体验反哺芯片迭代，形成闭环；OpenAI CEO Altman近年反复谈及芯片、能源、核聚变、数据中心。

反方 / 局限

— 短期看，OpenAI仍离不开英伟达的训练和通用计算GPU平台；Jalapeño不可能很快覆盖全部负载，大概率先进入最确定的推理场景。

Jalapeño OpenAI 英伟达博通黄仁勋 Altman Token 推理税 CUDA TPU

7 分钟 · 4 卡片 · 9 资料

读原文 →

GPT设计GPT

前置背景

平行视角

未来推演

延伸追问