7.6
深览指数
科技虎嗅·生物世界©··AI 生成

Nature:西湖大学郭天南团队提出“虚拟酵母”计划,用AI打造首个虚拟真核细胞

该文报道了西湖大学郭天南团队联合国内外数十个研究机构在Nature上发表的前瞻性文章,首次提出“虚拟酵母”(Virtual Yeast)计划。核心创新在于将真核细胞复杂性拆解为八个以功能为中心的AI模块,并由大语言模型统一调度,旨在构建能模拟酵母从基因表达到代谢产物全链条行为的可预测AI系统。文章详细阐述了技术架构、三大数据支柱及闭环学习策略,并指出这一框架未来可向人类细胞建模平移,服务于药物筛选和疾病研究。适合关注合成生物学前沿与AI-for-Science领域的科研人员和技术决策者阅读。原文 ↗

核心观点
  • 西湖大学郭天南团队提出了“虚拟酵母”计划,旨在利用AI构建首个可预测、可实验验证的虚拟真核细胞,它是一个能模拟酵母从基因表达到代谢产物全链条行为的AI智能体系统。
  • 该系统的核心创新在于摒弃了传统的整体数学方程建模思路,转而将细胞复杂性拆解为八个功能为中心的AI模块,并通过大语言模型(LLM)作为协调层进行统一调度,实现了模块化、可扩展的细胞模拟架构。
  1. 01研究团队在Nature上发表了前瞻性评述文章,提出了虚拟酵母计划,并联合了北京大学、上海人工智能实验室、复旦大学、斯坦福大学等数十个研究机构。
  2. 02选酵母作为模型生物,因酿酒酵母具备完整的真核细胞结构(细胞核、线粒体等),遗传工具丰富(全基因组敲除文库、GFP标签库),且与人类核心细胞过程高度保守。
  3. 03虚拟酵母的架构包含八个功能模块:膜系统、遗传中枢、线粒体能量、胞质代谢、生物合成网络、细胞骨架、应激处理和降解机器。每个模块由专门的AI工具(如变分自编码器、扩散模型、基因组基础模型等)实现。
  4. 04系统依靠三大数据支柱:先验生物学知识(酵母数据库如SGD、YMDB、YeastNet)、亚细胞空间架构数据(空间组学、冷冻电镜数据)和动态状态数据(已启动 969 个菌株在多种条件下的 1.5万份时间分辨蛋白组和5000份代谢组数据)。
  5. 05系统引入三重约束机制防止AI“胡编乱造”:知识图谱因果约束、物理规则约束(化学计量平衡)和强化学习反馈(用真实实验数据作为奖励信号)。
  6. 06项目采用“主动学习”策略,形成“模型预测→实验验证→数据反哺”的闭环,并已规划未来5-10年的分阶段实施路线图。
  7. 07代谢模块案例显示,AI模型结合基因组尺度代谢模型(GEM),在预测敲除哪些基因能提高工业氨基酸产量方面,比传统机器学习模型准确率更高。
反方 / 局限
  • 研究团队坦言,虚拟酵母不会是完美的“数字孪生”,无法也不可能精确模拟细胞里的每一个分子。
  • 文章主要描绘了宏伟的技术蓝图和阶段性成果,但对于大语言模型作为“总指挥”时可能出现的跨模块协调错误、幻觉对下游模块的传播效应,以及系统计算资源需求等工程化挑战着墨不多。
9 分钟 · 4 卡片 · 7 资料
读原文 →

前置背景

平行视角

未来推演

延伸追问