Patronus AI 获 5000 万美元融资，打造「数字世界」压力测试 AI 代理

5.8

深览指数

商业TechCrunch·Marina Temkin·10小时前·AI 生成

Patronus AI 获 5000 万美元融资，打造「数字世界」压力测试 AI 代理

AI 代理正从回答问题走向自主执行多步骤复杂任务，但尚未得到可靠验证。Patronus AI 通过创建网站和内部系统的数字复制环境，在强化学习训练后对代理进行压力测试，尤其擅长发现代理的“捷径”行为。该公司收入一年增长 15 倍，并获 5000 万美元 B 轮融资。本文适合关注 AI 安全、模型评估及 AI 企业服务的读者，可快速了解行业痛点与一种新兴解决方案的定位。原文 ↗原文 ↗

核心观点

▍AI 代理在真实世界中可靠运行前，需要在其训练后于模拟数字环境中进行压力测试，以识别其“走捷径”等失败模式。

01Patronus AI 由前 Meta AI 研究员 Anand Kannappan 和 Rebecca Qian 于 2023 年创立，总部位于旧金山。
02该公司使用“数字世界模型”复制网站和内部系统，在强化学习后对代理进行迭代测试，奖励成功、惩罚错误。
03Patronus 将其方法类比于 Waymo 在合成世界中训练自动驾驶汽车，以应对罕见危险场景。
04几乎所有前沿 AI 实验室和许多新兴初创公司都已成为其客户，需求接近“无法满足”。
05Patronus 过去一年收入增长 15 倍，并于近期完成由 Greenfield Partners 领投的 5000 万美元 B 轮融资，总融资额达 7000 万美元。
06公司目前专注于软件工程和金融领域的可验证问题，未来计划扩展至难以验证的领域。

反方 / 局限

— Patronus 的主要竞争对手是各 AI 实验室内部自建的代理评估团队，市场教育成本高。
— 文章承认，目前只解决了“可验证”的问题，大量“非可验证”或“极难验证”的领域尚未触及。

Patronus AI Anand Kannappan Rebecca Qian Glenn Solomon Greenfield Partners Notable Capital Lightspeed Datadog Samsung Waymo Mercor Surge AI 代理安全评估数字世界模型强化学习

8 分钟 · 5 卡片 · 15 资料

读原文 →

Patronus AI 获 5000 万美元融资，打造「数字世界」压力测试 AI 代理

概念锚点

前置背景

平行视角

未来推演

延伸追问