基于12导联心电图的深度学习模型在急诊科心脏疾病患者入院预测中的应用:一项回顾性队列研究
《JMIR Cardio》:Serial 12-Lead Electrocardiogram–Based Deep-Learning Model for Hospital Admission Prediction in Emergency Department Cardiac Presentations: Retrospective Cohort Study
【字体:
大
中
小
】
时间:2025年10月22日
来源:JMIR Cardio 2.2
编辑推荐:
急诊患者住院预测的深度学习模型开发及验证。基于MIMIC-IV数据库,整合序列心电图、动态生命体征及静态临床数据(如病史、实验室指标),构建多模态深度学习模型,实时预测急诊患者是否需住院。模型在两次及以上ECG患者队列中AUROC达0.924,优于ECG单模态(0.859)和传统随机森林(0.911)模型,预测时间早于ED离开时间中位数3.4小时,验证了多源数据融合对早期风险分层的价值。
在急诊科(Emergency Department, ED)中,患者拥挤问题一直是医疗系统面临的重要挑战。这种现象通常与医院入院流程缓慢有关,从而影响了护理质量。然而,对于出现心脏相关症状的患者,早期预测其是否需要住院仍然是一项复杂任务。尽管大多数患者最终被出院,但那些确诊为心脏病因的患者往往更可能被收治入院。因此,开发一种能够准确预测患者是否需要住院的模型,对于优化急诊资源利用、提升患者护理质量具有重要意义。
当前,急诊科通常依赖于初始评估,包括病史采集、体格检查、生命体征监测、心肌酶检测以及临床风险评分,如急诊严重程度指数(Emergency Severity Index, ESI)或HEART评分(History, ECG, Age, Risk factors, and Troponin)。然而,这些传统方法在预测患者风险时存在局限性,它们通常基于单一时点的数据,难以捕捉患者病情在就诊过程中的动态变化。此外,许多风险评分仅适用于特定的临床场景,如急性冠脉综合征,而无法广泛应用于所有心脏相关症状的患者。因此,研究者开始探索更先进的机器学习(Machine Learning, ML)方法,以整合多源数据,提高预测的准确性和实用性。
本研究旨在开发并验证一种实时的深度学习模型,该模型融合了连续记录的12导联心电图(Electrocardiogram, ECG)波形、生命体征数据以及常规临床信息,以预测急诊科患者是否需要住院。通过这种方式,模型可以更全面地捕捉患者的病情变化,从而提高预测的准确性。为了实现这一目标,研究团队使用了公开的MIMIC IV数据库,其中包括急诊科和重症监护病房(Intensive Care Unit, ICU)的数据。研究对象为出现胸痛、呼吸困难、晕厥或晕厥前兆的患者,且在急诊科就诊期间至少有一次心电图记录。最终纳入研究的患者共有30,421例,其中11,273例在就诊期间进行了至少两次心电图检查。
研究中,团队构建了三种不同的模型:一种是基于结构化临床变量的随机森林(Random Forest, RF)模型,另一种是仅基于心电图波形的模型,第三种是融合心电图、生命体征和结构化数据的多模态深度学习模型。所有模型的数据收集截止到最后一次心电图记录的时间。在所有患者群体中,多模态模型表现最佳,其接收者操作特征曲线下的面积(Area Under the Receiver Operating Characteristic Curve, AUROC)达到了0.911。而在至少两次心电图记录的子群体中,多模态模型的AUROC进一步提升至0.924,显著优于其他两种模型(P<.001)。
研究发现,尽管心电图可以单独用于预测患者是否需要住院,但其效果有限。相比之下,基于结构化数据的随机森林模型在所有患者群体中表现良好,其AUROC为0.886,而在至少两次心电图记录的子群体中,其表现更为突出,达到了0.911。然而,多模态模型在整合心电图、生命体征和结构化数据后,取得了更优的预测效果。这一结果表明,将心电图波形与动态的生命体征数据相结合,能够更全面地反映患者的病情变化,从而提高预测的准确性。
在研究中,团队还分析了不同数据类型的缺失情况。例如,在所有患者群体中,超过90%的实验室检测结果存在缺失,而生命体征中的温度数据缺失率则在41.8%到55%之间。这种数据缺失可能影响模型的性能,因此研究者采用了一种基于贝叶斯回归的插补方法,以处理缺失值。此外,研究团队还探讨了不同数据源的重要性,发现结构化数据中的实验室检测结果、药物使用情况、既往病史以及分诊等级在预测中起到了关键作用。然而,在至少两次心电图记录的子群体中,实验室检测数据的缺失率相对较低,因此这些特征对模型性能的贡献更大。
为了进一步验证模型的有效性,研究者进行了交叉验证分析,确保模型在不同数据子集中的表现一致性。结果显示,多模态模型在所有患者群体和至少两次心电图记录的子群体中均表现出色,其预测时间通常在分诊后的0.3小时到5.3小时之间,而患者最终离开急诊科的时间则在预测后4.6小时到7.3小时之间。这意味着,该模型能够在患者离开急诊科之前提供预测结果,为临床决策提供了充分的时间窗口。
在讨论部分,研究者指出,与传统的分诊工具相比,基于心电图的预测模型表现更优。例如,常规的ESI评分通常只能达到0.69到0.70的AUROC值,而基于深度学习的模型则可以实现更高的预测准确率。此外,研究团队还对比了其他相关研究,发现一些模型在预测患者住院方面取得了较高的准确率,但它们通常依赖于特定医院的数据或未考虑动态数据的变化。相比之下,本研究采用的多模态模型能够有效整合多种数据源,不仅提高了预测的准确性,还具备更强的泛化能力。
尽管研究取得了积极成果,但也存在一些局限性。首先,所有数据均来自单一中心的MIMIC IV数据库,这可能影响模型的推广性。因此,未来需要在多个医疗机构进行外部验证,以确保模型在不同环境下的适用性。其次,研究仅针对胸痛、呼吸困难、晕厥或晕厥前兆等常见心脏相关症状的患者,未涵盖其他类型的症状。未来的研究可以考虑扩大研究范围,以提高模型的通用性。
此外,研究团队还提到,许多变量存在较大的缺失率,这可能限制了模型的性能。例如,超过70%的患者在研究期间没有可见的既往药物使用记录,超过50%的患者没有既往诊断记录。因此,未来的模型可能需要更全面的病史数据,以进一步提高预测的准确性。最后,模型在预测过程中可能受到医院内部决策流程的影响,这可能引入一定的偏差。因此,研究者建议未来的工作应关注模型的可解释性,以增强临床医生对模型的信任,并优化其在实际医疗场景中的应用。
总体而言,本研究提出了一种新的多模态深度学习模型,能够有效整合心电图、生命体征和结构化临床数据,以预测急诊科患者是否需要住院。这一模型不仅在预测准确性上优于传统的单模态模型,还能够提供更早的预测结果,为急诊科的资源管理和患者护理提供重要支持。未来的研究应进一步验证模型的泛化能力,并探索如何在不同医疗环境中优化其性能。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号