编辑推荐:
本研究为解决传统统计方法难以应对COVID-19复杂因素交互问题,采用可解释机器学习方法构建预测模型,精准筛选出关键特征,助力临床精准管理与治疗决策,成果发表于《Scientific Reports》
自2020年2月COVID-19疫情暴发以来,其临床表现从轻微到严重不等,尽管疫苗和治疗手段不断进步,但仍有部分患者发展为重症,需要大量医疗资源。准确识别重症风险患者成为关键。为此,国内研究机构的研究人员开展了一项基于可解释人工智能技术的研究,旨在建立一个简单且准确的COVID-19严重程度预测模型,成果发表于《Scientific Reports》。
研究背景部分指出,COVID-19的重症化与多种因素相关,如肥胖、高龄、糖尿病等,但单一生物标志物难以精准预测重症。此前虽有基于传统统计方法的预测模型,但面对复杂因素交互时存在局限性。机器学习(ML)作为人工智能(AI)的分支,能够更有效预测复杂非线性结果,但存在模型复杂、难以解释和过拟合等问题。因此,研究人员结合强化学习与可解释机器学习方法,开发出简单易用的预测模型。
在研究方法方面,研究人员利用日本COVID-19任务小组数据库,收集了2020年2月至2022年10月间3301名18岁以上COVID-19患者的临床数据。这些患者被分为发现队列(1023名,疾病发作在2020年10月1日之前)和验证队列(2278名,剩余患者)。研究人员首先通过点式线性(PWL)模型和逻辑回归模型提取41个关键特征,再利用强化学习生成简单且预测准确率高的模型,最终模型以接收者操作特征曲线下面积(AUC)作为主要评估指标。
研究结果显示,预测模型仅使用4个特征(血清白蛋白水平、乳酸脱氢酶水平、年龄和中性粒细胞计数)就实现了AUC≥0.905的预测性能。在发现队列中,最高AUC值为0.906(敏感性0.842,特异性0.811);在验证队列中,AUC值为0.861(敏感性0.804,特异性0.675)。这表明该模型具有较高的预测准确性和可解释性,能够有效识别重症COVID-19患者。
在讨论部分,研究人员强调该研究首次开发出具有高可解释性和准确性的COVID-19严重程度预测模型,避免了过拟合风险,并在不同时间点的验证队列中验证了其可重复性。该模型简单易用,仅依赖于常见的临床指标和实验室检测结果,如年龄、乳酸脱氢酶(LDH)和白蛋白(Alb)水平等,具有较高的临床应用价值。此外,该模型在多中心数据基础上构建,更适用于日本患者群体,且与西方国家患者存在差异,对于指导日本COVID-19患者的临床管理具有重要意义。然而,研究也存在局限性,如未进行外部验证,研究时间跨度较短,未考虑疫苗接种情况等,未来需要进一步研究以完善模型。
综上所述,本研究通过创新性地结合可解释机器学习技术和强化学习方法,成功开发出一个简单、准确且易于临床应用的COVID-19严重程度预测模型,为COVID-19患者的精准管理和治疗决策提供了有力支持,具有重要的临床意义和社会价值。