7.8
深览指数
科技微博·晚点LatePost··AI 生成
从Cerebras IPO聊起:AI算力变化、Scaling law的萌芽和百度美研往事
通过对Cerebras早期投资人周楠的深度访谈,本文揭示了Cerebras在Wafer-Scale架构上的技术选择与商业逻辑,并回溯了2016-2017年百度美研在AI投资上的前瞻视野——当时研究员已形成“模型更大、数据更多、算力更强”的共识,甚至Dario Amodei的Deep Speech 2论文被视为Scaling Law的雏形。文章提供了英伟达之外异构芯片(尤其是推理场景)的竞争格局分析,同时也指出百度因地缘政治和内部基金受阻,错过了投资OpenAI、Anthropic等前沿公司的历史机会。适合关注AI产业投资、芯片技术路线及科技公司战略演进的深度读者。原文 ↗
核心观点
- ▍Cerebras的Wafer-Scale架构在推理场景(低延迟、高吞吐)有明显优势,是英伟达GPU路线之外的有效补充,但其规模化交付和客户多样性仍是关键风险。
- ▍百度美研在2016-2017年已形成“更大模型、更多数据、更强算力”的共识,并基于此寻找替代GPU的AI芯片,但因地缘政治和内部基金受阻,错过了投OpenAI、Anthropic等前沿公司的机会。
- 01Cerebras的投资源于百度研究员训练接近3亿参数的语言模型时遇到GPU训练一次需三个多月的痛点,Cerebras宣称可将训练效率提升千倍。
- 022017年投资Cerebras时,估值约7亿多美元,周楠当时测算2025年AI训练市场约220亿美元,按20%市占率回报3-5倍,但实际因市场爆发仍低估。
- 03Cerebras的创始团队有较高博士密度(80多人中近70个博士),且创始人Andrew Feldman是连续创业者(SeaMicro被AMD收购),能清晰拆解良率、散热、编译器、封装等风险。
- 04OpenAI与Cerebras签署了规模超200亿美元的合作协议,Sam Altman本人早在2016年就投资了Cerebras,表明其早期判断算力不能依赖单一供应商。
- 05百度美研顶峰时至少250多人,人才密度极高,Dario Amodei、Greg Diamos等均在其中,团队对Scaling Law的直觉源于Deep Speech 2论文(2015年)。
- 062020年,一些OpenAI的百度前同事联系周楠,提到GPT-3即将完成训练,并想创业但因不信任Sam Altman的安全态度而离开。
- 07市场转向AI投资的分水岭是ChatGPT Moment之后,顶级VC约在2023年后期至2024年才全面押注AI,之前主流共识仍是投SaaS。
反方 / 局限
- — Cerebras的Wafer-Scale方案规模化生产的良率、封装和散热仍是实际挑战,且客户高度集中(如OpenAI),尚未证明能在大量场景中替代英伟达的GPU生态。
- — 英伟达的护城河不仅在于芯片(H100、GB200),更包括CUDA生态、开发者社区、网络、软件工具链、客户信任和供应链管理,Cerebras难以短期撼动。
- — 百度美研的AI投资因地缘政治和内部基金募资失败而受阻,本质上反映了中国公司在硅谷做前沿AI研发和投资的结构性障碍,这或许解释了百度“起了大早、赶了晚集”的部分原因。
CerebrasWafer-Scale架构Scaling LawDeep Speech 2百度美研(百度硅谷人工智能研究院)吴恩达Dario AmodeiSam AltmanAndrew FeldmanGreg Diamos英伟达(NVIDIA)OpenAIAnthropicGPU推理(AI Inference)ASICGraphcore昆仑芯
32 分钟 · 5 卡片 · 12 资料
读原文 →