7.2
深览指数
科技36 氪·黄 楠··AI 生成

清华系团队做分布式预测世界模型、获数亿元A轮融资,落地终端设备达十万量级|硬氪首发

具身智能公司千诀科技获数亿元A轮融资,核心团队来自清华大学类脑研究中心。该公司采用不同于主流生成式路线的「预测式世界模型」,并进一步提出分布式预测架构,旨在解决特征污染问题,提升机器人在真实场景中的泛化能力与响应速度。文章通过与CEO和CTO的访谈,详细解释了预测式与生成式路线的本质区别,以及该技术路线在十万台级终端设备上的实际落地情况与客户反馈。适合关注具身智能、世界模型技术路线选择与商业化落地的读者。

核心观点
  • 千诀科技认为,主流的生成式世界模型通过像素级重构预测未来,存在「特征污染」问题,即模型被迫将有效特征与光影、纹理等无效噪声绑定,削弱了对物理世界因果关系的理解能力。
  • 该公司主张采用「预测式世界模型」,核心不是还原像素帧,而是预测低维物理状态的演化轨迹,并结合「分布式预测架构」(模仿人脑脑区分工),提升样本效率和推理速度。
  1. 01千诀科技CTO章天任指出,生成式模型为了像素级无损重构,可能将有效特征与任务无关的噪声(如光影、纹理)强行绑定,导致模型内部表征不「纯净」,泛化能力受限。
  2. 02CEO高海川以打球为例说明区别:人类不会在脑中想象清晰像素画面,而是依靠对球轨迹的低维预测直接挥拍。预测式世界模型因此输出的是低维抽象特征,可直接解码为动作指令。
  3. 03千诀科技的分布式预测架构将信息分到不同区域分别压缩和预测,团队声称可将新任务所需的状态-动作对从1000个减少到100个,有效降低机器人适应新场景的示教数据量。
  4. 04千诀科技将具身大脑与小脑解耦,世界模型负责感知、预测与规划,不绑定具体执行空间。同一「大脑」已适配轮式、四足、人形、无人机等多品类硬件,终端设备规模达十万台。
  5. 05在实际落地中,客户对响应速度极敏感,生成式模型4秒级响应基本不可用;千诀的预测式模型虽已做到0.5秒内返回,但部分客户仍反馈1秒云端传输延迟「卡顿」,优化到0.5秒以下才获得质变。
  6. 06客户超出预期的需求是机器人应具备「主动性」,能主动感知环境并自主决策(如机器人发现地面污渍主动清洁),而非被动等待指令。
反方 / 局限
  • 文章承认世界模型的长时推理误差会随步数累积,但认为具身任务多采用「执行-观测-修正」的闭环反馈机制,可有效抑制误差放大,因此开环超长时规划在真实场景中并不常见。
千诀科技清华大学类脑研究中心Yann LeCun(杨立昆)章天任高海川世界模型预测式世界模型生成式世界模型分布式预测架构特征污染
8 分钟 · 4 卡片 · 9 资料
读原文 →

概念锚点

前置背景

平行视角

延伸追问