基于可穿戴设备深度学习模型的院内患者持续恶化预测系统的开发与验证
《Nature Communications》:Development and validation of a clinical wearable deep learning based continuous inhospital deterioration prediction model
【字体:
大
中
小
】
时间:2025年11月04日
来源:Nature Communications 15.7
编辑推荐:
本研究针对非ICU病房传统间歇性生命体征监测可能延误病情识别的问题,开发了一种基于临床级可穿戴设备的深度学习模型。该模型利用9项连续监测指标(包括人口统计学数据和生命体征),通过循环神经网络(RNN)预测未来24小时内的临床警报和不良结局。验证结果显示,该模型能提前17小时预测临床警报(AUC 0.89±0.03)和不良结局(准确率81.8%),其性能优于传统间歇性监测工具,且在不同设备间具有良好泛化能力,为及时干预提供了新途径。
在普通内科和外科病房,每3-4小时一次的生命体征监测就像黑暗中偶尔闪亮的手电筒,可能会错过患者病情恶化的早期信号。据统计,高达5%的非重症住院患者会出现需要升级护理的临床恶化,而延迟识别与死亡率和并发症增加密切相关。更令人担忧的是,即使在某些设置了连续监测(CM)的病房,许多系统仍使用简单的阈值报警,导致警报疲劳和有用警报被忽视的恶性循环。
传统的早期预警评分(EWS)主要基于间歇性收集的电子健康记录(EHR)数据,而新兴的可穿戴技术能够连续监测生命体征,为更早发现异常提供了可能。然而,现有研究大多局限于小样本或仅验证设备测量的准确性,缺乏利用大规模连续监测数据开发预测模型的工作。
在这项发表于《Nature Communications》的研究中,Michael R. Scheid领衔的研究团队开展了一项创新性研究,他们开发并验证了一种基于可穿戴设备的深度学习模型,用于持续预测院内患者的临床恶化。该研究收集了来自四家医院的888名非ICU住院患者的连续监测数据,覆盖2897个患者日,是迄今为止该领域规模最大的研究之一。
研究人员使用了两种胸戴式可穿戴设备(Vital Connect Vital Patch和Biobeat Chest Monitor)连续监测生命体征,并与传统间歇性监测进行了比较。他们采用长短期记忆(LSTM)循环神经网络,利用人口统计学数据和连续监测的生命体征特征,训练了一个能够预测未来0.5-24小时内临床恶化的模型。
研究团队进行了三个阶段的严格验证:使用训练设备(Device#1)的保留数据进行回顾性验证;在不同医院使用同一设备进行前瞻性验证;以及使用完全不同设备(Device#2)进行外部验证,确保了结果的可靠性。
关键技术与方法方面,研究团队首先通过Bland-Altman图验证了可穿戴设备与人工生命体征测量的一致性,确保数据质量。然后基于改良早期预警评分(MEWS)生成临床警报标签,定义为MEWS>6持续30分钟以上。他们开发了LSTM模型,使用5小时的生命体征序列预测未来24小时内的恶化风险,并与逻辑回归(LR)模型和仅使用EHR数据的模型进行性能比较。研究还分析了运动对警报的影响,并测试了模型在预测硬终点(如心脏骤停、死亡等)方面的表现。
研究发现,可穿戴设备与EHR生命体征测量具有良好一致性。心率(HR)测量中,67%的值落在10%偏差线内,表明足够的心率一致性可用于建模。虽然呼吸频率(RR)的一致性较低(29-45%),但考虑到EHR中RR常测量不准确,研究仍将其纳入。血氧饱和度(SpO2)和温度测量也显示出良好一致性,分别有77-87%和99%的测量值落在5%偏差线内。
可穿戴设备检测到的临床警报数量是手动监测的9倍(140个警报)。90%的警报仅由设备检测到,不到3%仅出现在EHR中。对于两者都检测到的7%的警报,基于可穿戴设备的警报平均比EHR警报提前105分钟。这种差异主要来自RR和HR测量,它们对MEWS评分的贡献分别是其他生命体征的30倍和10倍。
运动分析显示,增加的运动与升高的生命体征测量或MEWS值之间没有相关性(HR-R2=0.01,RR-R2=0.02),表明警报的产生与运动无关,而是由真实的生理恶化信号触发的。
LSTM模型在三个验证阶段均表现出色。在Device#1回顾性验证中,模型ROC曲线下面积(AUC)为0.89±0.03,精确召回曲线下面积(PR AUC)为0.58±0.14,显著优于逻辑回归模型。在前瞻性验证和不同设备验证中,模型也保持了良好性能,证明了其鲁棒性。
使用训练检测MEWS升高的RNN模型测试其在预测硬终点方面的表现,结果显示:50%的快速反应团队(RRT)呼叫、83.3%的非计划ICU转移、100%的心脏骤停和100%的死亡被检测到。这一性能优于仅使用EHR数据或升高MEWS作为预测因子的方法。
模型预测临床警报的中位前置时间为17.12小时(回顾性数据)至24小时(前瞻性数据),预测硬终点的中位前置时间为16.5小时。采样率分析显示,从1分钟到300分钟的采样间隔,ROC AUC下降16.2%,PR AUC下降17.0%,表明较高采样率有利于模型性能,但30分钟间隔仍可保持较好性能。
该研究的讨论部分强调了几个重要发现。首先,可穿戴设备与EHR测量具有足够的一致性,且由于高频、准确的RR和HR测量,能产生更多、更早的临床警报。其次,深度学习模型利用连续监测数据能更准确地预测患者恶化,其性能优于传统方法。最重要的是,模型能提前8-24小时预测临床警报,提前17小时预测硬终点,为临床干预提供了宝贵时间窗口。
研究还指出,模型在校准方面存在过度自信的问题,这是现代神经网络架构的已知特性,但通过重新校准可以改善。尽管硬终点数量有限(仅11个事件),但初步验证显示了该方法在预测严重临床结局方面的可行性。
这项研究的重要意义在于它提出了一个全面的院内连续监测框架,经过不同患者群体、医院设置和设备的验证。该框架不仅能早期识别患者恶化,还能通过可调节的警报阈值适应不同的风险承受能力和资源考虑,为改善患者安全和降低医院成本提供了有前景的解决方案。
研究的局限性包括硬终点数量有限,以及患者选择可能存在的偏倚。未来研究可通过更严格的患者入选标准和收集更多数据来进一步验证算法在硬终点预测方面的能力。总体而言,这项工作为将连续监测整合到常规住院护理中奠定了坚实基础,代表了数字健康领域的重要进展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号