6.5
深览指数
科技量子位·闻乐··AI 生成

全球首个英伟达含量为0的万亿模型,成了海外开发者的抢手货

美团发布万亿参数MoE大模型LongCat-2.0,总参数量达1.6万亿,其独特之处在于从训练到推理完全基于国产算力芯片,不依赖英伟达硬件。模型在OpenRouter上以匿名身份「Owl Alpha」提前上线,并在Agent场景的月调用量排行中位居前列,证明了市场对其能力与性价比的认可。文章详细介绍了LongCat-2.0在架构(如LongCat稀疏注意力、N-gram Embedding)和工程层面(自动化故障处理、适配国产芯片的算子库)为克服国产芯片劣势所做的原创设计。适合关注国产AI芯片生态、大模型工程化提效以及AI基础设施成本分析的技术决策者与研究人员阅读。原文 ↗

核心观点
  • LongCat-2.0是首个在国产算力上实现从训练到推理全链路闭环的万亿参数大模型,证明了国产算力已具备支撑先进大模型持续迭代的能力。
  • 该模型在OpenRouter上以匿名身份「Owl Alpha」上线,月调用量位列Agent场景的前列,表明其市场接受度已经过真实流量验证。
  1. 01LongCat-2.0总参数量达1.6万亿,采用MoE混合专家架构,每token激活约48B参数,原生支持1M超长上下文。
  2. 02文章通过长文本信息提取、代码仓库重构(2048游戏改配色与尺寸、前端从原生JS迁移到React)、以及多步骤Agent任务(联网调研生成报告)等测试,展示了LongCat-2.0的综合能力。
  3. 03为克服国产芯片单卡显存小、通信带宽低、软件生态不成熟等短板,团队提出了原创架构如LongCat稀疏注意力(LSA)和N-gram Embedding,并重写了算子和并行方案。
  4. 04工程层面,团队搭建了自动化故障处理体系,将集群日均故障率从万分之15.7降至万分之4.4,并支持训练任务从2560张卡扩展至5万张。
  5. 05通过一系列优化,集群的硬件利用率(MFU)从17.8%提升至27.68%,单日Token处理能力从7170亿提升至1.12万亿。
  6. 06美团布局国产算力已有三年,从2023年搭建集群验证千亿参数训练,到2024年验证MoE架构,再到2026年落地万亿参数模型。
反方 / 局限
  • 文章主要基于美团官方技术博客和一篇带有营销性质的测评文章,缺乏第三方独立、横向的评测验证,其提供的测试用例可能存在选择性展示。
  • 虽然文章声称「英伟达含量为0」,但并未详细披露所使用的国产芯片品牌、型号及具体性能参数(如总算力、芯片间带宽),使得成本与性能优势的量化对比难以进行。
  • 文章的论证从技术实现直接跳到了未来「建设物理世界AI底座」的宏大叙事,缺乏具体的产品规划和商业落地路径。
15 分钟 · 4 卡片 · 10 资料
读原文 →

前置背景

平行视角

未来推演

延伸追问