基于多模态时空数据的深度学习模型预测住院患者SEIRD状态:一种提升医院感染个体化风险评估的新策略
《International Journal of Medical Microbiology》:A deep learning approach to predicting hospitalized patients’ SEIRD states using multimodal spatiotemporal data
【字体:
大
中
小
】
时间:2025年11月03日
来源:International Journal of Medical Microbiology 3.6
编辑推荐:
本研究针对医院感染(HAI)预测中个体化风险评估的不足,开发并评估了三种多模态深度学习模型。研究人员利用合成的医院时空数据,重点比较了集成式(HeteroGC-LSTM)、解耦式(LSTM+DCRNN)和新型混合式架构在预测患者SEIRD(易感、暴露、感染、康复、死亡)状态方面的性能。结果表明,混合模型在7天预测窗口内取得了最佳准确率(78.96%)和F1分数(0.75),显著优于其他模型。该研究为开发实时临床决策支持系统、优化感染控制措施提供了重要方法论支持,展现了在多模态医疗数据分析领域的创新价值。
在医院这个复杂的生态系统中,一种看不见的威胁正在悄然蔓延——医院感染(HAI)。由于抗菌药物耐药性(AMR)的加剧,医院感染已成为全球公共卫生领域的重大挑战。据世界卫生组织2023年报告,AMR在2019年直接导致全球127万人死亡,并对495万人的死亡有所贡献。其中,艰难梭菌(Clostridioides difficile)是目前引起住院患者感染性腹泻的主要病原体,其在北美和欧洲的感染率持续攀升。
传统的流行病学预测模型多聚焦于群体层面,难以提供针对个体患者的精准风险评估。而医院感染预测面临着时空维度的双重挑战:时间上,患者互动和感染风险动态变化;空间上,患者和医护人员的流动构成了复杂的传播网络。更棘手的是,医院人群存在显著的不平衡性,感染患者只占少数,这为构建稳健的预测模型带来了巨大困难。
为了解决这些挑战,来自意大利东皮埃蒙特大学计算机科学研究所的研究团队在《International Journal of Medical Microbiology》上发表了一项创新研究。他们开发了三种不同的深度学习架构,旨在利用丰富的医院时空数据进行精准的个体层面HAI风险预测。
研究人员采用了三种不同的时空数据整合策略:集成式方法使用异构图卷积长短期记忆网络(HeteroGC-LSTM)进行统一学习;解耦式模型结合了独立的长短期记忆网络(LSTM)和扩散卷积循环神经网络(DCRNN)组件;最关键的是,他们提出了一种新型混合模型。这种混合架构首先让专门组件从时空数据中独立学习不同表征,然后通过联合微调阶段智能融合这些预训练表征。
研究团队使用经过同行评审的合成医院模拟数据集H-outbreak进行严格评估,该数据集精细捕捉了真实世界的患者移动和感染动态。他们采用分层10折交叉验证,以准确率和F1分数作为评估指标。
研究基于H-outbreak模拟器生成的合成数据集,采用SEIRD(易感、暴露、感染、康复、死亡) compartmental model表示患者健康状态。数据处理涉及将医院空间结构转换为图网络,患者信息处理为时间序列。核心模型架构包括:异构图卷积LSTM(HeteroGC-LSTM)、LSTM处理时序数据、DCRNN处理空间图数据。训练采用交叉熵损失函数,使用Adam/AdamW优化器,并实施早停法防止过拟合。
在7天预测窗口的基线情况下,混合模型表现出最佳性能,准确率达78.96%,F1分数为0.75,显著优于解耦模型(71.46%准确率,0.72 F1)和集成模型(57.73%准确率,0.42 F1)。混合模型在不同实验条件下均表现出一致优越性,并展现出更好的泛化能力和鲁棒性。
评估不同预测窗口大小时,解耦和混合模型在3天、7天和14天窗口下均表现稳定,而HeteroGC-LSTM在所有窗口大小下得分均较低。值得注意的是,HeteroGC-LSTM的训练时间是其他模型的两倍。
在不同医院规模(200-1200床位)的测试中,解耦和混合模型在准确率和F1分数上均表现出稳定性能。随着医院规模增大,所有模型的训练时间相应增加,但混合模型始终保持最佳性能。
研究分析表明,当前最先进的时空数据分类模型在同时考虑病原体循环的环境因素和感染传播的时间进程方面存在局限性。HeteroGC-LSTM架构难以学习时空趋势,主要归因于图规模和时间长度的计算复杂性、梯度流问题、跨数据类型的不一致性以及对噪声的敏感性。
混合方法优于解耦方法的性能表明,它更适应SEIRD预测问题的本质。感染传播同时依赖于空间(患者间直接或间接接触)和时间因素(潜伏时间、感染持续时间)。能够同时学习这些模式的模型可以充分利用最大信息量。
该预测模型对临床医生具有重要价值,它可以补充识别患者特异性感染风险。这使得临床医生和预防医学专家能够接收关于HAI高风险患者的实时警报,有助于立即实施预防措施,例如实施预防性隔离、改进预防性抗生素的使用或加强关键区域的卫生实践。
集成空间维度的模型使得识别医院中的"热点区域"成为可能,即感染最可能传播的区域。这使得可以将直接的消毒和控制资源分配给这些区域,从而实现更有效的干预和更高效的医院资源利用。
需要认识到的是,使用模拟器生成数据集可能存在局限性。合成数据虽然真实,但可能无法完全捕捉真实医院环境的复杂性。获得这种详细程度的真实数据对于更全面评估至关重要。
该研究的建模选择体现了在关键医疗应用中优先考虑数据高效、可解释且具有强领域相关偏置模型的更广泛建议。LSTM网络相较于Transformer模型,在参数数量较少、对序列依赖具有内置假设的条件下,在这些条件下表现更加稳健,且需要较少数据即可有效泛化。
总之,这项研究强调了混合深度学习策略的有效性,该策略巧妙地将医院空间和时间数据的专门学习与后续联合微调过程相结合。这种创新方法即使在复杂的、真实世界代表性的合成数据集上评估,也展现出了卓越的患者个体HAI风险预测能力。所展示的性能和方法论见解表明,该方法在实时临床决策支持和感染控制措施优化方面具有重要潜力。其固有的适应性使其成为在不同医疗环境中部署的有前景的基础,未来工作将集中于使用真实世界临床数据进行验证。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号