基于电子健康记录的COVID-19住院与死亡风险预测模型开发与验证研究

《Prevention Science》:Development and Validation of an Electronic Health Record-Derived Prediction Model for Preventing COVID-19 Hospitalization and Death

【字体: 时间:2025年10月21日 来源:Prevention Science 2.7

编辑推荐:

  本刊推荐:为应对COVID-19门诊抗病毒治疗精准化需求,研究团队开发并验证了基于EHR的机器学习预测模型。该模型通过LASSO变量选择和ridge惩罚逻辑回归,纳入了19个风险因素,AUC达0.825(95%CI 0.813-0.836),在高风险组(前10%)的真阳性率达48%,阳性预测值为9.9%。该模型实现了跨种族亚组和时间维度的稳健性能,为医疗系统开展靶向二级预防提供了重要工具。

  
当COVID-19疫情进入第三年,尽管疫苗接种普及和病毒毒力减弱,但住院和死亡仍然是公共卫生系统面临的严峻挑战。尤其令人困扰的是,如何在门诊快速识别可能进展为重症的高风险患者,从而精准使用帕克斯洛维(Paxlovid?)等抗病毒药物。这类药物虽能降低89%的住院死亡风险,但必须在症状出现5天内使用,且存在药物相互作用和1500美元的治疗成本。更复杂的是,传统仅依赖年龄(≥65岁)或特定基础疾病的筛选标准,可能遗漏年轻高危人群,同时加剧种族间的治疗不平等。
在此背景下,凯撒医疗华盛顿健康研究中心的R Yates Coley团队开展了一项创新研究,通过电子健康记录(EHR)构建机器学习预测模型,实现了对COVID-19感染者14天内住院或死亡风险的精准评估。该研究近日发表于《预防科学》(Prevention Science),为医疗系统开展靶向二级预防提供了重要工具。
研究团队采用的关键技术方法包括:利用医疗系统数据仓库筛选67,530例门诊COVID-19感染事件(2020年4月-2022年11月),通过十折交叉验证进行LASSO变量选择与ridge惩罚逻辑回归,最终确定19个核心预测变量;采用前瞻性验证模拟临床实施场景,并特别针对种族亚组进行公平性评估。所有分析均基于门诊感染事件(排除住院期间确诊病例),结局指标为14天内全因住院或死亡复合终点。
样本特征
研究纳入64,529名患者的67,530次感染事件,其中1378次(2.0%)出现结局事件。2022年感染占62%,但仅贡献21%的结局事件,反映奥密克戎变异株时期风险显著降低。65岁以上患者事件发生率(4.15%)为年轻组(1.5%)的2.7倍,而美洲原住民/阿拉斯加原住民(7.9%)、拉丁裔(3.7%)等群体的风险显著高于非拉丁裔白人(1.7%)。
预测建模结果
模型包含年龄、疫苗接种史、合并症等19个预测因子,其中“有色人种”复合变量(非白人种族/民族)被强制保留以促进健康公平。最终模型显示优异性能:总体AUC为0.825(95%CI 0.813-0.836),18-64岁亚组达0.802(0.787-0.818)。当以风险评分前10%为阈值时,总体真阳性率(TPR)为48%,阳性预测值(PPV)达9.9%。
种族亚组性能验证
模型在18-64岁各种族亚组均保持稳定表现:亚裔、黑人、拉丁裔和非拉丁裔白人患者的AUC介于0.78-0.81,且在前10%高风险组中TPR均达48-51%。美洲原住民/夏威夷原住民等高风险群体的TPR更高,与其基础风险水平相符,体现模型的公平性适应能力。
时间稳健性检验
通过迭代训练历史数据并验证后续两个月表现,发现AUC始终维持在0.8以上,但分类准确性随病毒变异、疫苗接种率变化呈现波动。例如,2021年中PPV可达15-22%,而2022年下半年降至7%以下,提示阈值需动态调整以适应疫情演变。
临床实施阈值分析
针对18-64岁无免疫抑制/慢性肺病患者的最新数据(2022年4-11月)显示,将高风险阈值设为前10%时,可捕获27%的结局事件(PPV=7.1%),而扩展至前15%仅额外增加8%的TPR。基于效益-资源平衡,凯撒医疗最终选择前10%作为治疗推荐阈值。
该研究的创新之处在于首次系统验证了预测模型在真实世界临床场景中的时空普适性与种族公平性。通过将种族变量纳入预测因子,模型显著提升了对医疗资源获取不足群体的风险识别能力,有望纠正帕克斯洛维处方中的种族差异。此外,研究提出的动态阈值管理策略,为应对快速变异的呼吸道病毒提供了范式参考。
然而,模型仍存在局限性:结局指标包含非COVID-19相关住院/死亡,且仅覆盖医疗系统内记录的感染事件。因此,模型更适合作为临床决策的辅助工具,而非因果推断的依据。目前该模型已在凯撒医疗华盛顿分院投入临床应用,其开源框架为其他医疗系统适配类似模型奠定了基础,标志着学习型医疗系统向精准化公共卫生干预迈出关键一步。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号