
-
生物通官微
陪你抓住生命科技
跳动的脉搏
老年人群血尿重金属暴露与心力衰竭的关联:基于NHANES的可解释机器学习模型研究
【字体: 大 中 小 】 时间:2025年05月27日 来源:International Journal of Cardiology Cardiovascular Risk and Prevention 1.9
编辑推荐:
本研究针对重金属暴露与心力衰竭的复杂关联,利用NHANES数据库(2003–2020)构建了五种机器学习模型,最终选定梯度提升决策树(GBDT)作为最优模型(准确率0.78,AUC 0.92)。研究发现尿碘、血镉、尿钴等重金属与心力衰竭显著相关,并揭示了年龄与BMI的协同效应,为环境暴露致心血管疾病的风险评估提供了新方法。
心血管疾病是全球健康的主要威胁,而心力衰竭(Heart Failure, HF)作为其终末阶段,影响着全球超6000万人,终生发病风险高达24%。尽管传统研究已发现镉、铅等重金属与HF的关联,但多数依赖线性统计模型,难以捕捉复杂非线性关系,且缺乏多金属交互作用的系统性分析。更关键的是,老年人群因长期暴露和环境累积效应,可能面临更高的重金属相关HF风险,但这一领域的研究仍存在空白。
为填补这一空白,研究人员基于美国国家健康与营养调查(NHANES)2003–2020年的数据,纳入6879名50岁以上参与者,通过机器学习方法探索血尿重金属与HF的关联。研究团队首先采用随机森林插补法(missForest)处理缺失数据,并利用互信息法(mutual information)筛选特征。通过比较支持向量机(SVM)、随机森林(RF)、XGBoost、梯度提升决策树(GBDT)和K近邻(KNN)五种模型,最终选择GBDT作为最优模型(训练集AUC 0.92,敏感度0.93)。为增强可解释性,研究结合SHAP(Shapley Additive exPlanations)、置换特征重要性(Permutation Importance)和个体条件期望图(ICE)等方法,揭示了关键风险因素及交互效应。
3.1 基线特征分析
HF组与非HF组在年龄(69.74±8.39 vs 65.33±9.04)、BMI(32.92±16.51 vs 29.53±7.22)及血镉(几何均值0.48 vs 0.40 μg/L)等13种重金属指标上存在显著差异(P<0.05),提示这些因素可能与HF发病相关。
3.2 模型性能比较
GBDT在测试集中表现稳健(AUC 0.81),显著优于其他模型(如KNN AUC 0.73)。其高敏感度(0.93)表明对HF病例的识别能力优异,但较低精度(0.20)提示需优化以减少假阳性。
3.3 模型可解释性
讨论与意义
本研究首次通过可解释机器学习整合多金属暴露数据,证实血镉、尿钴等与HF的独立及协同关联。尤其发现尿碘(几何均值183.23 ng/mL in HF组)的强预测性,为既往较少关注的元素提供了新证据。环境重金属可能通过氧化应激(Oxidative Stress)和表观遗传修饰等机制促进HF,而年龄与BMI的协同效应提示老年肥胖人群需重点监测。尽管横断面设计限制因果推断,但GBDT模型的高效能为临床风险分层提供了工具。
该研究发表于《International Journal of Cardiology Cardiovascular Risk and Prevention》,其创新性体现在:1)突破传统统计局限,利用机器学习捕捉非线性关联;2)首次系统评估血尿多金属联合效应;3)通过SHAP等技术实现“黑箱”模型的可视化解读。未来需扩大队列验证,并探索重金属拮抗剂(如螯合剂)在HF预防中的潜在价值。
生物通微信公众号
知名企业招聘