7.8
深览指数
科技虎嗅·集智俱乐部··AI 生成

Nature: AI医生MIRA首次“全流程上岗”

Nature 发表研究,提出自主医疗 AI 智能体 MIRA。区别于只会答题的医疗大模型,MIRA 首次在沙盒电子病历环境中,通过多工具联动走完问诊、开检查、诊断、治疗、入院的全流程诊疗闭环。在与人类医师的对照试验中,MIRA 诊断准确率(87.8%)显著高于专科医师(78.1%)和轮转医师(71.1%),治疗方案与临床规范贴合度更高,且未观察到高危用药错误。文章同时指出,MIRA 距离真实临床落地仍有距离,核心挑战在于人机责任划分与监管体系建设。适合关注医疗 AI 前沿、AI Agent 落地、以及医疗体系数字化转型的读者。原文 ↗

核心观点
  • 现有医疗AI只能完成答题或单一诊疗环节,MIRA首次在沙盒EHR环境中实现了从问诊到入院的全流程自主诊疗闭环,证明了AI Agent在医疗领域具备端到端行动能力。
  1. 01MIRA基于MIMIC-IV数据库500余例急诊真实病例(涵盖阑尾炎、胰腺炎、肺炎等8类疾病),在仿真环境中与人进行对照试验。
  2. 02MIRA在匹配病例子集(n=311)中的平均诊断准确率为87.8%,显著高于持证专科医师组的78.1%和基层轮转医师组的71.1%(双侧McNemar检验,P=0.000287)。
  3. 03MIRA内置11类临床工具、85,000余种可执行临床操作,兼容FHIR、ICD、LOINC、SNOMED-CT等六大国际通用医疗编码体系。
  4. 04在检查规划上,MIRA遵循由无创到有创的诊疗逻辑,未出现过度使用CT、MRI等高成本影像检查的现象。
  5. 05在治疗决策环节,MIRA的诊疗规范依从性比医师高出35个百分点;阑尾炎病例中,对腹腔镜阑尾切除术的推荐匹配率达到100%。
  6. 06系统性安全评估显示,在56份完整病例中未观察到高危用药错误,近500条处方信息准确率接近满分。
反方 / 局限
  • 研究全部基于历史病历文字构建的仿真交互环境,无法复刻真实患者说话含糊、信息矛盾、遗漏病史的复杂情况。
  • 训练所用的MIMIC-IV数据集可能已流入大模型训练素材,试验测出的效果存在虚高可能。
  • MIRA全程仅运行在隔离沙盒环境,从未对接医院真实业务系统,真实病房的突发状况未经验证。
  • MIRA的抗生素处方仍未完全符合指南规范,表明关键治疗决策仍需要保留人工复核机制。
13 分钟 · 4 卡片 · 9 资料
读原文 →

前置背景

平行视角

未来推演

延伸追问