基于初级保健的老年抑郁筛查可解释机器学习模型:多算法比较研究及其临床转化价值

《Journal of Affective Disorders》:Primary-care-focused interpretable machine learning model for depression screening in geriatrics: A comparative study of multiple algorithms

【字体: 时间:2025年10月28日 来源:Journal of Affective Disorders 4.9

编辑推荐:

  本文推荐一款针对老年抑郁筛查的初级保健机器学习(ML)模型。研究基于NHANES数据,采用LASSO回归筛选特征并应用SMOTE处理类别不平衡,比较七种算法后发现XGBoost模型表现最优(测试集准确率0.82,AUC达0.88)。通过SHAP提升可解释性,识别睡眠障碍、性别、PIR等关键预测因子,为基层医务人员提供高效筛查工具。

  
Highlight
研究参与者与研究设计
本研究采用美国疾病控制与预防中心(CDC)与国家卫生统计中心(NCHS)联合开展的全国健康与营养调查(NHANES)数据。NHANES旨在评估美国人口的健康状况与生活方式行为。NCHS研究伦理审查委员会批准了所有数据收集程序,并获得了所有参与者的书面知情同意。
参与者的基线特征
最终分析共纳入3802名参与者,其中933人(24.54%)被识别为患有抑郁。如表1所示,抑郁组与非抑郁组在各种人口统计学、社会经济和临床特征上均观察到统计学显著差异(p < 0.05)。
与非抑郁组相比,抑郁组参与者更可能为女性(56.70% 对比 42.80%),并且平均年龄略低。
讨论
研究使用七种机器学习算法开发了抑郁筛查模型,并纳入了通过特征选择确定的13个关键变量。比较性能分析表明,XGBoost算法优于其他算法。进一步的模型可解释性评估显示,睡眠障碍、性别、贫困收入比(PIR)、白蛋白(Albumin)和 segmented neutrophil count(Segs)是XGBoost模型中最具影响力的预测因子。
先前已有研究利用NHANES数据库开发抑郁预测模型。例如...
结论
本研究开发了一个采用13个关键变量的机器学习模型,用于筛查老年人抑郁,并证明了其作为临床适用诊断辅助工具的潜力。通过引入SHAP分析,提高了模型的可解释性,从而能更清晰地洞察每个预测因子的贡献。这一进展为早期抑郁筛查提供了一个实用且科学依据充分的工具,有助于在初级保健和临床环境中进行及时识别和干预。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号