基于机器学习的慢性阻塞性肺疾病患者抑郁风险预测模型构建与验证

【字体: 时间:2025年07月04日 来源:BMC Psychiatry 3.4

编辑推荐:

  本研究针对慢性阻塞性肺疾病(COPD)患者抑郁高发但筛查困难的临床痛点,通过整合NHANES队列1,638例患者的临床数据,采用Boruta-LASSO算法筛选关键预测因子,构建了支持向量机(SVM)预测模型(AUC达0.890)。该模型首次揭示睡眠障碍、低社会经济地位等非传统因素与抑郁的强关联,为COPD患者心理健康早期干预提供智能化工具。

  

在全球第三大死因慢性阻塞性肺疾病(COPD)患者群体中,抑郁如同"隐形杀手"——超过30%的患病率是普通人群的3倍,却因症状重叠、筛查工具复杂导致漏诊率居高不下。更棘手的是,抑郁会形成恶性循环:患者因呼吸困难产生负面情绪,负面情绪又降低治疗依从性,最终导致急性加重风险提升40%、死亡率增加30%。传统量表筛查依赖主观填报,而基于线性回归的预测模型难以捕捉睡眠质量、社会经济地位等复杂因素的交互作用,这正是德阳市人民医院联合成都医学院团队开展本研究的初衷。

研究团队创新性地采用美国国家健康与营养调查(NHANES)2005-2018年多周期数据,纳入1,638例符合GOLD标准的COPD患者,以患者健康问卷(PHQ-9)≥10分定义抑郁终点。通过Boruta随机森林扩展算法与LASSO回归双重筛选,从42个候选变量中锁定21个关键预测因子,包括睡眠障碍、年龄、贫困指数等非传统指标。采用ADASYN自适应过采样技术解决数据不平衡问题后,对比9种机器学习模型发现SVM表现最优,最终构建的在线预测工具(http://www.xsmartanalysis.com)可实现个体化风险评估。

基线特征
抑郁组(n=289)与非抑郁组(n=1,349)比较显示:抑郁患者中女性占比55.4%显著高于非抑郁组(39.9%),家庭收入中位数仅为1.18(0.75-1.92)倍贫困线,睡眠障碍发生率高达74.7%(vs.15.9%)。实验室指标中,抑郁组白细胞计数(8.2 vs 7.4×103/μL)和中性粒细胞(5.1 vs 4.5×103/μL)显著升高,提示炎症机制可能参与抑郁发生。

预测因子筛选
如图2所示,Boruta算法与LASSO回归共同识别出11个核心变量:睡眠障碍(SHAP值最高)、年龄(<60岁风险增加)、贫困指数、高血压、心血管疾病(CVD)等。值得注意的是,传统认知中的吸烟年限、肺功能指标未被纳入,而淋巴细胞计数等炎症指标保留在模型中。

模型性能
SVM模型在验证集展现卓越判别力:AUC 0.890(95%CI 0.882-0.898),灵敏度81.3%,特异度79.4%。如图5所示,决策曲线分析证实当阈值概率在0.2-0.8区间时,使用该模型每100人可净增29例正确识别。SHAP分析揭示睡眠障碍可使抑郁风险提升3.2倍,而大学学历则降低风险41%。

这项发表于《BMC Psychiatry》的研究突破了传统抑郁筛查的三大局限:首次将机器学习应用于COPD抑郁预测,实现AUC性能提升12.5%;揭示炎症指标(WBC、中性粒细胞)与抑郁的剂量效应关系,为"肺-脑轴"理论提供新证据;开发的在线工具仅需输入7项临床常规数据即可完成风险评估。局限性在于NHANES数据的美国人群代表性,未来需在亚洲队列验证。该模型已被GOLD指南引用,建议将睡眠质量评估纳入COPD患者常规随访,这对降低30%的抑郁相关再入院率具有重要临床意义。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号