5.0
深览指数
科技量子位··AI 生成
卡帕西李飞飞辛顿都投了的Transformer专用芯片,签下10亿美元大单
AI芯片创业公司Etched宣布其Transformer专用ASIC芯片成功流片,并获得10亿美元客户订单及8亿美元新融资。该公司从芯片、机柜到软件系统全栈设计,通过低电压推理等创新架构实现万亿参数级MoE模型的高效推理,计划今年夏天出货首批机柜。与那些强调通用性的AI芯片不同,Etched自成立起就聚焦Transformer架构,并获得了卡帕西、李飞飞、辛顿等AI领域重量级人物的投资。文章详细介绍了创始团队的背景(哈佛辍学生)和公司技术路线,但作为公司官宣稿,缺乏第三方独立评测和对技术局限性的讨论。原文 ↗
核心观点
- ▍Etched公司凭借专注于Transformer架构的专用ASIC芯片,成功流片并获得了10亿美元的大客户订单,证明了在AI推理市场,专用芯片路线相比通用GPU存在巨大商业价值和技术优势。
- 01Etched芯片使用台积电N4P工艺流片,其设计包含低电压推理(LVI)技术,能在低于大多数AI芯片一半的电压下运行数学模块,实现了数倍于现有AI芯片的浮点运算密度。
- 02该公司推出了集群规模内存(CSM)架构,基于HBM/SRAM混合设计并采用专有的超低延迟、高带宽互连技术,旨在解决大型MoE模型在多芯片间路由时面临的内存容量与延迟的平衡问题。
- 03Etched声称其首批机柜能支持万亿参数级MoE模型在80%以上峰值FLOPs下稳定运行,且不出现热降频,早期客户测试显示其在推理吞吐量、延迟和能效方面达到领先水平。
- 04公司已获得8亿美元融资,投资方包括卡帕西、李飞飞、辛顿等AI领域知名人士,以及彼得·蒂尔的Thiel Fellowship支持。
- 05创始团队为三名哈佛辍学生,CEO Gavin Uberti在2022年创立公司,专注于从计算架构层面解决Transformer推理瓶颈。
反方 / 局限
- — 文章本质上是公司官方融资和流片成功的宣布稿,完全从Etched自身视角出发,缺少对技术路线的独立第三方验证,也没有提及专用ASIC芯片在面对非Transformer模型或快速变化的AI算法架构时的风险与灵活性不足。
- — 文章未讨论与英伟达等公司现有通用推理解决方案的直接成本、性能对比,也未评估其宣称的性能指标在真实客户复杂部署场景下的可靠性。
EtchedTransformerASICGavin Uberti克里斯·扎 (Chris Zhu)罗伯特·沃肯 (Robert Wachen)台积电英伟达安德烈·卡帕西 (Andrej Karpathy)李飞飞 (Fei-Fei Li)杰弗里·辛顿 (Geoffrey Hinton)Thiel FellowshipMoE (混合专家模型)大规模并行处理器 (GPU)
9 分钟 · 5 卡片 · 12 资料
读原文 →