7.2
深览指数
科技微博·量子位··AI 生成

黄仁勋说的Physical AI,被这家中国跨界选手带进了生命科学实验室

华大智造子公司涌生智能与上海人工智能实验室联合发布ProtoPilot多智能体系统和BioLab Bench评测体系,首次实现从自然语言实验意图到真实湿实验物理执行的完整闭环。该成果在第三方评测ProtocolQA上超越OpenAI旗舰模型GPT-5.6 Sol,且在四组递进难度湿实验中验证了实际执行能力。文章认为,AI for Bio的竞争正从模型能力转向干湿闭环完整性,而涌生智能从实验室设备侧生长AI的路径,比硅谷从模型侧空降的路线更具优势。适合关注AI产业落地、生命科学自动化或中国硬科技竞争态势的读者。原文 ↗

核心观点
  • AI for Bio 的竞争正在从 '谁的模型更强' 转向 '谁的干湿闭环更完整',而涌生智能从设备侧生长 AI 的路线,比硅谷从模型侧空降更有效。
  • ProtoPilot 是全球首个在生命科学实验室补上从实验意图到物理执行关键一步的 AI 系统。
  1. 01在第三方评测 ProtocolQA 上,ProtoPilot 开放式问答得分 52.38%(人类专家 54%),非开放式问答得分 85.18%,均超越 OpenAI 旗舰模型 GPT-5.6 Sol(43.5%)。
  2. 02在 Protocol 生成任务上,ProtoPilot 综合评分 94.7/100,L3 最高复杂度任务通过率 60%,而作为行业标杆的 OpenTrons-AI 直接归零。
  3. 03ProtoPilot 在 Protocol2Code 环节的 Gate Pass Rate 达 96.6%,远超第二名 LabScript-AI 的 64.6%;在四个主流自动化平台上波动仅 5.9 个百分点,而 LabScript-AI 波动达 47.1 个百分点。
  4. 04在四组递进难度湿实验中,ProtoPilot 完成了 96 孔板接菌培养(100% 生长)、24 个菌落 PCR(100% 扩增)、质粒构建与定点突变、以及基于 PCA 方法的 DNA 组装(初筛阳性率 96.9%,4 条目标序列全部构建成功)。
  5. 05ProtoPilot 具备自我修正能力,在一次 PCA 组装失败后,分析出抗性筛选问题并自动生成修正方案,第二轮成功获得测序确认的 DNA 产物。
  6. 06BioLab Bench 是生命科学领域首个从用户需求到设备可执行的全流程 Agent 评测体系,覆盖需求理解、方案设计、SOP、设备代码到真实执行的全链路。
  7. 07涌生智能成立于 2025 年 3 月,是华大智造子公司;其母公司华大智造拥有 PrepALL、AlphaTool 等 Agent-ready 智能实验自动化产品,全球超 3800 家用户。
反方 / 局限
  • 文章未提及 ProtoPilot 在处理超大规模或高通量实验(如全基因组筛选)上的性能表现,其实际泛化能力需更多独立验证。
  • 文中评价标准(如盲评)与评测主数据均来自联合发布方自身,缺乏第三方独立复现报告。
16 分钟 · 4 卡片 · 11 资料
读原文 →

前置背景

平行视角

未来推演

延伸追问