基于随机森林的急性呼吸道感染患者肺炎风险预测模型构建及关键生物标志物分析

【字体: 时间:2025年07月16日 来源:Biosafety and Health 3.5

编辑推荐:

  本研究针对急性呼吸道感染(ARI)进展为肺炎的早期预测难题,采用随机森林算法从64项临床指标中筛选关键预测因子,发现D-二聚体水平升高(aOR=1.002)和甲型流感病毒(IFV-A)感染(aOR=9.308)是肺炎发生的独立危险因素,为临床早期识别高风险患者提供了机器学习支持的新策略。

  

急性呼吸道感染(ARI)作为临床常见病症,虽然多数表现为轻度自限性症状,但其进展为肺炎后将显著增加疾病负担。全球数据显示,呼吸道感染相关标准化伤残调整寿命年率达384.9/10万,而肺炎患者的住院费用中位数高达9791美元。当前临床面临两大困境:一是传统炎症标志物如C反应蛋白(CRP)缺乏特异性;二是病原体检测指标与肺炎发展的关联强度不明确。在此背景下,重庆市疾病预防控制中心的研究团队开展了一项横断面研究,成果发表在《Biosafety and Health》上。

研究团队采用多阶段机器学习方法,首先通过随机森林算法从64个临床变量中筛选重要特征,再构建逻辑回归列线图模型。关键技术包括:1)在重庆8个区县23家医院采集1638例ARI患者数据;2)使用呼吸道病原体核酸多重检测试剂盒检测16种病原体;3)采用10折交叉验证评估模型性能(C-index=0.83);4)基于AIC准则优化预测模型。

研究结果部分:

  1. 基线特征分析

    肺炎组(10.9%)年龄更大(中位32岁),郊区居民比例更高(27.4%)。病原体检测显示肺炎组IFV-A(49.2% vs 39.6%)、IFV-B(26.3% vs 18.6%)和呼吸道合胞病毒(RSV)(6.1% vs 1.9%)感染率显著升高。

  2. 血液指标差异

    79例完成全套检测的患者中,肺炎组血红蛋白(130.00 g/L)、血尿素氮(5.73 mmol/L)、CRP(36.10 mg/L)、降钙素原(PCT)(0.11 μg/L)和D-二聚体(0.95 μg/L)水平显著升高,而中性粒细胞(4.20×109/L)和尿酸(280.90 μmol/L)水平降低。

  3. 预测模型构建

    随机森林筛选出年龄、中性粒细胞等10个关键变量。最终模型显示D-二聚体每升高1单位,肺炎风险增加0.2%(95%CI:1.001-1.004);IFV-A感染者肺炎风险是非感染者的9.3倍(95%CI:2.433-35.606),模型C-index达0.88。

讨论部分强调了三个重要发现:首先揭示了IFV-A与细菌(如流感嗜血杆菌和肺炎链球菌)的协同致病机制,病毒破坏呼吸道上皮屏障后促进细菌继发感染;其次证实D-二聚体作为凝血激活标志物,其水平升高反映肺炎相关的全身炎症反应;最后建立的预测模型为临床早期识别高风险患者提供了量化工具。尽管存在血液检测数据不全的局限,但这项研究创新性地整合了病原学检测与机器学习算法,为ARI患者的精准管理提供了新思路。研究建议临床应重点关注IFV-A感染伴D-二聚体升高的患者,这对降低肺炎疾病负担具有重要公共卫生意义。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号