机器学习算法构建 COVID-19 重症风险预测模型:精准评估与关键指标探索

【字体: 时间:2025年05月14日 来源:BMC Public Health 3.5

编辑推荐:

  为解决 COVID-19 重症风险预测问题,研究人员基于逻辑回归、Cox 回归、支持向量机(SVM)和随机森林算法构建预测模型。结果显示 SVM 模型预测准确率最高,氧合指数(OI)是关键预测指标。该研究为临床决策提供依据。

  在全球公共卫生领域,疾病的爆发总是让人猝不及防。世界卫生组织警告,一种由未知病原体引起的不可预测的传染病 ——“Disease X” 可能爆发,而 COVID-19 很可能就是首个 “Disease X”。面对这样的潜在危机,提前做好疫情防控准备至关重要。以往的 COVID-19 预测模型存在诸多问题,有的利用单一数据来源,预测准确性受限;有的深度学习模型虽准确率高,但缺乏临床可解释性,且数据获取困难。因此,为了更精准地预测 COVID-19 重症风险,为临床决策提供有力支持,天津大学等机构的研究人员开展了相关研究。该研究成果发表在《BMC Public Health》上。
研究人员开展的研究主要运用了以下关键技术方法:从天津 6 家医疗机构收集了 1485 例 COVID-19 住院患者的临床特征数据(包括 10 个基础护理变量和 40 个实验室检测变量);运用逻辑回归(LR)、Cox 回归、支持向量机(SVM)和随机森林(RF)算法构建预测模型;通过 5 折交叉验证和网格搜索法对模型超参数进行调优;利用 SHapley Additive exPlanation(SHAP)对模型进行解释 。

下面来看具体的研究结果:

  • 数据处理与变量筛选:研究人员收集了大量患者数据,对 50 个临床变量进行分析。通过 P 值分析、临床专家共识、文献回顾和模型迭代分析等方法,最终筛选出 14 个代表性变量。这些变量相互之间相关性较弱,可作为独立变量代入模型。同时,对缺失数据进行了相应处理。
  • 预测模型构建与评估:将数据集按 7:3 分为训练集和测试集,分别用 4 种算法构建快速有效预测模型(REPM)和准确综合预测模型(ACPM)。结果显示,SVM 在 REPM 任务中表现最佳,预测准确率达 98.45%,AUC 为 0.994 ;LR 在 ACPM 任务中预测准确率最高,为 98.23% 。整体上,SVM、LR 和 RF 的预测性能优于 Cox 回归。
  • 模型预测变量分析:通过 SHAP 分析,发现氧合指数(OI)是 SVM 模型中最重要的预测变量,其次是混淆、呼吸频率(RR)和年龄。OI 低于 300 mmHg 时,患者重症风险显著增加。

在研究结论与讨论部分,SVM 模型展现出卓越的预测能力,其在 REPM 预测任务中的高准确率、高灵敏度和高特异性,以及高 AUC 值,均优于其他对比模型。这得益于研究使用的多中心大样本数据,使模型能学习到更细微的模式和关联。同时,研究明确了 OI 是 COVID-19 重症风险的关键预测指标,它反映了肺部气体交换功能,对指导临床治疗,如判断是否需要氧疗或机械通气具有重要意义。

然而,该研究也存在一定局限性。数据仅来自天津地区的 6 家医院,模型的普适性可能受到地域因素的限制,未来需要在更多不同地区进行验证。此外,模型评估指标相对单一,主要集中在预测准确性上。但总体而言,该研究构建的预测模型具有较高的准确性和可解释性,模型所需变量易于获取,有助于医生更准确地预测患者病情进展,为构建疾病风险预测模型提供了重要的方法和技术指导,对降低 COVID-19 重症率和死亡率具有重要意义。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号