老年人群血尿重金属暴露与心力衰竭的关联:基于NHANES的可解释机器学习模型研究

【字体: 时间:2025年05月27日 来源:International Journal of Cardiology Cardiovascular Risk and Prevention 1.9

编辑推荐:

  本研究针对重金属暴露与心力衰竭的复杂关联,利用NHANES数据库(2003–2020)构建了五种机器学习模型,最终选定梯度提升决策树(GBDT)作为最优模型(准确率0.78,AUC 0.92)。研究发现尿碘、血镉、尿钴等重金属与心力衰竭显著相关,并揭示了年龄与BMI的协同效应,为环境暴露致心血管疾病的风险评估提供了新方法。

  

心血管疾病是全球健康的主要威胁,而心力衰竭(Heart Failure, HF)作为其终末阶段,影响着全球超6000万人,终生发病风险高达24%。尽管传统研究已发现镉、铅等重金属与HF的关联,但多数依赖线性统计模型,难以捕捉复杂非线性关系,且缺乏多金属交互作用的系统性分析。更关键的是,老年人群因长期暴露和环境累积效应,可能面临更高的重金属相关HF风险,但这一领域的研究仍存在空白。

为填补这一空白,研究人员基于美国国家健康与营养调查(NHANES)2003–2020年的数据,纳入6879名50岁以上参与者,通过机器学习方法探索血尿重金属与HF的关联。研究团队首先采用随机森林插补法(missForest)处理缺失数据,并利用互信息法(mutual information)筛选特征。通过比较支持向量机(SVM)、随机森林(RF)、XGBoost、梯度提升决策树(GBDT)和K近邻(KNN)五种模型,最终选择GBDT作为最优模型(训练集AUC 0.92,敏感度0.93)。为增强可解释性,研究结合SHAP(Shapley Additive exPlanations)、置换特征重要性(Permutation Importance)和个体条件期望图(ICE)等方法,揭示了关键风险因素及交互效应。

3.1 基线特征分析
HF组与非HF组在年龄(69.74±8.39 vs 65.33±9.04)、BMI(32.92±16.51 vs 29.53±7.22)及血镉(几何均值0.48 vs 0.40 μg/L)等13种重金属指标上存在显著差异(P<0.05),提示这些因素可能与HF发病相关。

3.2 模型性能比较
GBDT在测试集中表现稳健(AUC 0.81),显著优于其他模型(如KNN AUC 0.73)。其高敏感度(0.93)表明对HF病例的识别能力优异,但较低精度(0.20)提示需优化以减少假阳性。

3.3 模型可解释性

  • SHAP分析:尿碘、血镉和年龄对HF预测贡献最大(SHAP值>0.1)。血镉与年龄的交互作用显示,老年高镉暴露者风险陡增。
  • 置换重要性:尿铍(重要性得分0.147)和血镉(0.084)位列重金属前两位,远超其他金属。
  • ICE与PDP图:血镉与HF风险呈剂量-反应关系,而尿铍呈现倒U型曲线,暗示阈值效应。

讨论与意义
本研究首次通过可解释机器学习整合多金属暴露数据,证实血镉、尿钴等与HF的独立及协同关联。尤其发现尿碘(几何均值183.23 ng/mL in HF组)的强预测性,为既往较少关注的元素提供了新证据。环境重金属可能通过氧化应激(Oxidative Stress)和表观遗传修饰等机制促进HF,而年龄与BMI的协同效应提示老年肥胖人群需重点监测。尽管横断面设计限制因果推断,但GBDT模型的高效能为临床风险分层提供了工具。

该研究发表于《International Journal of Cardiology Cardiovascular Risk and Prevention》,其创新性体现在:1)突破传统统计局限,利用机器学习捕捉非线性关联;2)首次系统评估血尿多金属联合效应;3)通过SHAP等技术实现“黑箱”模型的可视化解读。未来需扩大队列验证,并探索重金属拮抗剂(如螯合剂)在HF预防中的潜在价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号