6.4
深览指数
科技36 氪·智东西··AI 生成
小米罗福莉:Fable 5只是阶段性成果
在智源大会上,小米、生数科技、面壁智能、南洋理工大学四位AI大佬深度对话。罗福莉认为Claude Fable 5本质是Scaling三个维度(预训练、数据、强化学习)持续扩展的阶段性成果,并非质变。刘知远指出Anthropic成功源于找到代码这一数据闭环的垂直领域,并认为应探索更多行业的数据飞轮路径。对话还涉及AI自进化、世界模型、智能体Harness等前沿话题,观点各有侧重,但均认同物理世界模型路径更早期、潜力更大。
核心观点
- ▍Claude Fable 5并非质变,而是Scaling在预训练规模、数据规模和强化学习三个维度持续扩展后的阶段性成果。
- ▍Anthropic的成功在于找到了代码这一能在数字世界快速形成数据闭环的垂直领域,这给AI应用落地带来了启示:应探索更多专业领域的数据闭环可能性。
- 01罗福莉:Fable 5的参数规模可能达到当前最强开源模型数倍水平,并在Test-Time Scaling以及强化学习方面投入大量算力。
- 02罗福莉:模型训练数据正从互联网文本扩展到Agent产生的合成数据,Unique Token规模从40T-80T迈上新台阶。
- 03朱军:新版本模型在企业任务中的Token消耗明显下降,这是正确方向,模型应依靠更高层次智能而非单纯消耗更多Token。
- 04刘知远:代码大模型的成功意味着数据在数字世界完全发生,容易闭环;如果能在其他专业领域也形成数据闭环,可以加速AI在各行业应用。
- 05安波:在AI能力较弱时,自进化要行得通,前提是环境不能完全封闭,完全封闭地搞数据飞轮很难行得通。
- 06罗福莉:顶尖模型已经从解决执行问题外延到能够设计验证指标、规划实验流程,但在提出假设和判断研究价值方面与顶尖研究员仍有差距。
- 07朱军:视频和世界模型的Scaling潜力还非常大,数据获取量增加、架构优化才刚刚开始。
反方 / 局限
- — 安波:并非所有问题都能通过Coding解决,对于很多问题Coding完全无法解决,可能需要寻找其他路径。
- — 朱军:文中最常讨论的System 2/慢思考/推理模式强化学习,对于大模型基础能力的边际收益已不大,更应关注如何提升模型的数据与知识利用效率。
罗福莉朱军刘知远安波Anthropic小米生数科技面壁智能南洋理工大学智源研究院Claude Fable 5Scaling LawAI自进化世界模型AI CodingAgent Harness
28 分钟 · 5 卡片 · 15 资料
读原文 →