基于多模态数据融合推断医院内耐药菌无症状携带者:基因组学与患者流动网络的协同作用

《Nature Communications》:Inferring asymptomatic carriers of antimicrobial-resistant organisms in hospitals using genomic, microbiological and patient mobility data

【字体: 时间:2025年11月20日 来源:Nature Communications 15.7

编辑推荐:

  本研究针对医院内抗菌药物耐药性生物(AMRO)无症状携带者难以识别的问题,开发了一种结合基因组学、微生物学检测和患者流动数据的新型推断框架。研究人员利用基于数据驱动的机制传播模型,整合临床培养结果、电子健康记录和全基因组测序(WGS)等多模态观测数据,实现了对碳青霉烯耐药肺炎克雷伯菌(CRKP)携带概率的精准估计。结果表明,多模态数据协同使用可显著提高无症状携带者识别准确率,模型模拟验证了基于推断的靶向隔离策略可降低14.8%-28.0%的耐药菌负担。该研究为医院感染控制提供了数据融合的新范式,发表于《Nature Communications》。

  
在医院这个救死扶伤的前线战场,一场无声的战争正在上演——抗菌药物耐药性生物(AMRO)的传播。这些“超级细菌”中,碳青霉烯耐药肺炎克雷伯菌(CRKP)尤为棘手,它不仅对最后防线的碳青霉烯类抗生素产生耐药,更善于“潜伏”:大量无症状携带者成为隐蔽的传染源。传统监测依赖临床培养,但仅能捕捉冰山一角。如何从稀疏、异构的医院数据中精准识别这些“隐形传播者”,成为感染控制的关键难题。
为破解这一困境,哥伦比亚大学Sen Pei团队在《Nature Communications》发表研究,开发了创新推断框架。该研究巧妙融合四种数据类型:患者流动记录构建的时间演化接触网络、电子健康记录(EHR)中的24项风险因素、临床培养结果,以及全基因组测序(WGS)数据。通过基于主体的模型(ABM)模拟传播动态,并采用序列个体水平推断(SILI)算法进行多模态数据融合,实现了对无症状携带者的精准定位。
研究团队采用三大核心技术方法:首先利用真实世界5年住院记录(193,909名患者)构建动态接触网络,模拟CRKP传播;其次开发贝叶斯算法,将临床培养、EHR风险评分和WGS识别的传播事件转化为统一携带概率估计;最后通过集成调整卡尔曼滤波校准模型参数,确保推断准确性。

接触网络与传播模型

研究通过分析纽约市三级医院5年数据,发现患者接触呈现显著异质性:最长住院患者(浅蓝色节点)形成密集连接簇,接触持续时间分布高度偏态(图1b-c)。基于此构建的ABM模型包含三个关键参数:社区输入率γ、院内传播率β和自发去定植率α(图1d)。

多模态数据推断框架

框架通过三步实现数据融合(图2):首先将EHR风险因素(糖尿病、透析史等)通过逻辑回归转化为初始携带概率;其次利用临床培养结果(考虑10%有效灵敏度)更新观测患者概率;最关键的是,对WGS识别的高置信度传播事件(SNP距离≤15),通过网络路径分析将基因组信息扩散至关联患者群。

模拟疫情验证性能

在50周模拟疫情中,多模态数据(Test+EHR+Seq)将曲线下面积(AUC)提升至0.92(图3a)。特别在传播路径相关患者亚组中,WGS数据带来显著提升:路径患者识别准确率提高12%(图3b),其室友群体准确率提高8%(图3c)。对前50位高风险患者的日筛查显示,融合方法在疫情后期持续领先(图3d)。

真实世界CRKP携带推断

应用至真实世界411例CRKP阳性患者显示,仅用临床培养时23.8%阳性者位列风险前5%;加入EHR数据后提升至29.0%;进一步融合WGS数据达30.2%(图4a)。对传播路径上的113例患者,多模态推断将前5%识别率提升至37.2%(图4b),显著优于基于住院时长、接触追踪等启发式方法。

靶向隔离模拟干预

基于推断的靶向隔离模拟显示,每周隔离风险排名前1%患者(10-13人),可减少15.9%感染病例(图5a)和14.8%定植患者日(图5b);隔离比例提升至5%时,降幅进一步扩大至28.0%和22.8%(图5c-d),显著优于其他策略(p<0.001)。
该研究突破性地实现了多模态数据在医院感染控制中的协同增效。尽管WGS数据稀疏(仅220株测序),但通过网络路径分析成功将基因组信息扩散至时空关联患者群,证实“少而精”的基因组监测亦可提升推断效能。研究还揭示了当前监测体系的局限性:31.3%新入院患者缺乏历史病历造成“冷启动”问题,日均仅1%患者接受检测导致数据稀疏性挑战。
讨论部分指出,该框架可推广至其他AMROs,补充实验显示对不同输入率和传播率场景均保持稳健性。研究同时承认三大局限:未显式建模医护人员流动和环境储源,假定房间同质传播率,以及症状触发检测的未建模偏差。未来可通过医患二分网络、空间异质性建模等进一步提升实用性。
这项研究为医院耐药菌防控提供了从“被动监测”到“主动推断”的范式转变。通过数学建模与多源数据的深度融合,使精准识别无症状携带者成为可能,为资源有限环境下实施靶向干预提供了科学依据。随着基因组测序成本的下降和医院数字化程度的提升,这种数据驱动的方法有望成为未来感染控制的标准工具。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号