基于机器学习算法和集成方法的儿童COVID-19重症预测模型:随机森林与超级学习器的比较研究

【字体: 时间:2025年08月10日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对儿童COVID-19患者缺乏特异性重症预测工具的问题,通过整合588例患儿的多维度临床数据,系统评估了随机森林(RF)、梯度提升机(GBM)等6种机器学习(ML)算法及超级学习器(SL)集成模型的预测效能。结果显示RF模型准确率达90.1%,SL集成进一步降低风险估计值,关键预测因子包括血氧饱和度(O2 saturation)、呼吸急促(tachypnea)等指标。该研究为儿科临床决策提供了首个基于ML的可解释性预测框架。

  

在全球持续应对COVID-19变种传播的背景下,儿童患者独特的临床表现给重症预警带来特殊挑战。与成人不同,儿科病例更易出现多系统炎症综合征(MIS-C)等特殊并发症,但现有预测模型多基于成人数据开发。德黑兰医科大学儿科感染病研究中心的Babak Pourakbari团队在《Scientific Reports》发表的研究,首次系统评估了机器学习在儿童COVID-19重症预测中的应用价值。

研究人员采用回顾性队列设计,从伊朗转诊中心纳入588例RT-PCR确诊患儿(367例非重症/221例重症),整合93项特征包括 demographics、实验室指标(WBC、LDH等)和CT影像特征。通过GBM/RF特征筛选最终保留50个关键变量,采用70:30划分训练集/测试集。研究亮点在于同时比较6种算法(RF、GBM、KSVM等)并首次引入SL集成框架,通过10折交叉验证优化模型组合。

特征选择与模型性能

通过相关性分析(r>0.75剔除)和GBM/RF双重筛选,确定血氧饱和度、LDH等50个核心预测因子。RF模型表现最优(准确率90.1%,AUC 0.972),其SHAP分析显示O2 saturation贡献度达0.1007,远高于第二位的tachypnea(0.0071)。GBM和KSVM紧随其后,而SL集成将风险估计进一步降低15%,证实集成学习在临床预测中的优势。

关键临床启示

与成人模型不同,该研究揭示呼吸参数(O2 saturation、tachypnea)而非慢性病是儿童重症核心预测因子。胸部CT评分和LDH等实验室标志物的重要性提示肺部损伤和炎症反应的关键作用。研究团队特别指出,即使轻度低氧(O2 saturation<94%)也应警惕病情恶化风险。

局限与展望

单中心回顾性设计可能影响泛化性,且未处理类别不平衡问题。未来需通过多中心前瞻性验证,并探索实时预测系统集成。该研究为开发儿科特异性AI辅助工具奠定基础,尤其在Omicron变异株流行期间,其构建的预测框架可快速适配新发呼吸道传染病预警。

这项研究的创新性在于:首次将SL集成框架应用于儿科COVID-19预测;通过SHAP等可解释AI技术揭示儿童特异性生物标志物;为资源有限地区提供基于常规检测指标的实用预测工具。随着AI在临床决策支持系统的深入应用,此类研究将加速精准儿科医疗的发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号