基于可解释机器学习的PFAS暴露与糖尿病风险关联研究:揭示关键生物标志物及非线性效应

【字体: 时间:2025年06月24日 来源:Ecotoxicology and Environmental Safety 6.2

编辑推荐:

  推荐:本研究通过12种机器学习算法分析NHANES数据(2003-2018),首次建立PFAS暴露与糖尿病(DM)风险的预测模型。LightGBM表现最佳(AUC=0.84),发现PFOA呈负相关(阈值2.48 ng/mL),PFOS/PFNA呈正相关,并开发了临床风险评估工具,为环境健康策略提供新见解。

  

糖尿病(Diabetes Mellitus, DM)全球患病率持续攀升,预计2045年患者将达6.93亿,其防治已成为公共卫生重大挑战。近年研究发现,全氟烷基物质(Per- and polyfluoroalkyl substances, PFAS)这类广泛应用于防水防油产品的合成化学物,可能与代谢紊乱相关,但流行病学研究结论矛盾——部分显示PFAS暴露与胰岛素抵抗、血糖指标升高正相关,另一些却报告无显著关联甚至负相关。这种分歧可能源于PFAS种类、暴露水平、人群特征的差异,以及传统统计方法对非线性剂量-响应关系的捕捉不足。

为厘清这一科学问题,中国研究人员利用美国国家健康与营养调查(NHANES)2003-2018年数据,首次采用可解释机器学习(Interpretable ML)技术系统评估PFAS与DM的复杂关联。研究团队比较了12种算法性能,最终选择LightGBM模型(AUC 0.84)进行深入解析,发现关键PFAS化合物呈现截然不同的风险模式:全氟辛酸(PFOA)表现出显著负相关,而全氟辛烷磺酸(PFOS)和全氟壬酸(PFNA)则显示正向关联。这些突破性成果发表于环境健康领域权威期刊《Ecotoxicology and Environmental Safety》。

研究采用三大关键技术:1)基于NHANES队列的10471名参与者数据,通过KNN算法处理缺失值;2)运用LightGBM模型进行特征重要性排序和SHAP(SHapley Additive exPlanations)值解析;3)结合部分依赖分析(Partial Dependence Analysis, PDA)和局部加权散点平滑(LOWESS)曲线揭示非线性关系。

3.1 整体特征
DM组年龄、BMI显著高于非DM组(62.0 vs 47.7岁,32.3 vs 28.8 kg/m2),且PFOA浓度更低(2.78 vs 3.05 ng/mL),PFOS更高(12.8 vs 11.9 ng/mL)。

3.3 机器学习模型比较
LightGBM在12种算法中脱颖而出,测试集AUC达0.84,灵敏度0.83,准确率73%,显著优于随机森林(RF)和XGBoost等模型。

3.4 特征重要性分析
BMI和年龄是最强预测因子,PFOA位列第三且是影响力最大的PFAS化合物,其SHAP值显示持续负向贡献。

3.5 部分依赖分析
PFOA呈现明显"剂量-反应"关系:当浓度低于2.48 ng/mL时,DM风险急剧下降;PFOS和PFNA则显示"J型"曲线,低浓度时风险增幅显著。二维PDP揭示PFOA能中和其他PFAS的协同效应。

3.6 SHAP分析
LOWESS曲线量化关键阈值:PFOA标准化截断值-0.27(实际值2.48 ng/mL),PFOS 0.13(13.26 ng/mL),为临床监测提供精确参考。

3.7 网络风险计算器
基于Gradio框架开发的交互工具(https://huggingface.co/spaces/Machine199710/DM),整合人口统计学、PFAS暴露等参数实现个体化风险评估。

这项研究通过可解释机器学习揭示了传统方法难以捕捉的复杂规律:PFOA的负相关可能与其激活PPAR-α通路改善糖脂代谢有关,而PFOS/PFNA的正相关可能源于氧化应激和线粒体损伤。研究创新性地识别出PFAS混合暴露的阈值效应和交互作用,为环境污染物风险评估提供了新范式。尽管存在横断面设计无法确立因果关系的局限,但开发的在线预测工具可直接服务于临床实践,推动糖尿病预防从"症状管理"向"暴露预防"的范式转变。未来需通过前瞻性队列验证发现,并探索PFAS与其他环境污染物(如重金属、双酚A)的联合效应,为制定精准公共卫生策略提供科学依据。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号