7.4
深览指数
科技TechCrunch·Rebecca Bellan··AI 生成

General Intuition 23 亿美元押注:视频游戏能否为现实世界训练 AI 智能体

通用人工智能公司 General Intuition 以 23 亿美元估值完成 3.2 亿美元融资,其核心战略是用数十亿小时的游戏录屏(含玩家按键标签)训练一个通用的空间-时间推理模型。该模型已能同时操控游戏角色和真实四足机器人,且仅需少量真实数据微调即可在新的物理环境中自主导航。公司创始人强调其独特的行动标签数据(而非纯视频)是区别于竞争对手的关键壁垒,同时设定了严格的反军事用途伦理底线。本文适合关注 AI 智能体、世界模型、具身智能以及训练数据范式创新的从业者和研究者阅读。原文 ↗

核心观点
  • General Intuition的核心赌注是:利用游戏录屏中嵌入的玩家按键标签(行动数据),比仅用视频训练,能更有效地教会AI智能体空间-时间推理和因果理解,从而弥合虚拟训练与真实世界部署之间的鸿沟。
  1. 01公司从母公司Medal获取数十亿小时带有精确按键标签的游戏录屏作为初始训练数据。
  2. 02其模型已在一块屏幕上运行《堡垒之夜》AI智能体,同时控制一只四足机器人实地探索办公室,仅用8分钟真实世界机器人数据微调即完成。
  3. 03公司展示了其世界模型(内部称为“健身房”),AI智能体在其中学会了墙壁不可穿越、梯子可攀爬等物理规则。
  4. 04公司创始人Pim de Witte认为,大多数竞争对手试图仅从视频推断行动,但纯视频数据不足以让模型区分“自我”与“环境”,无法建立丰富的因果理解。
  5. 05本轮融资由Khosla Ventures领投,跟投方包括General Catalyst、杰夫·贝佐斯、埃里克·施密特、前F1车手尼科·罗斯伯格以及谷歌DeepMind和MIT的研究人员。资金主要用于扩大计算能力。
反方 / 局限
  • 公司承认,从模拟到真实世界的迁移能否规模化是一个未解决的关键问题,目前没有任何公司能够完全做到。
  • 作者也指出,General Intuition并非唯一尝试解决该问题的公司,竞品众多。
  • 虽然创始人标榜了明确的伦理红线(禁止用于致命自主武器),但报告中没有详细讨论其技术被滥用(例如用于非致命但有害的监管、监控)的潜在风险,也没有涉及数据隐私问题。
22 分钟 · 3 卡片 · 3 资料
读原文 →

前置背景

技术原理

平行视角