基于可解释 SHAP 的机器学习模型预测 2 型糖尿病合并冠心病及特征分析:助力精准诊断与健康管理

【字体: 时间:2025年04月02日 来源:Acta Diabetologica 3.1

编辑推荐:

  为解决 2 型糖尿病(T2DM)合并冠心病(CHD)预测模型性能不佳、受其他共病干扰等问题,研究人员开展基于 XGBoost 结合 SHAP 的预测模型研究。结果显示 XGBoost 性能优越,且确定关键预测特征,对提升 T2DM-CHD 诊断效率有潜在意义。

  背景:2 型糖尿病(Type 2 diabetes)和冠心病(coronary heart disease)在中国人群中的患病率不断升高,是主要的死亡原因。糖尿病与冠心病并存,因其诊断困难、预后不良,带来了沉重的疾病负担。近年来,机器学习在医学诊断应用中频繁出现,但 2 型糖尿病合并冠心病的预测模型存在预测性能较低、预测时受其他共病干扰等问题。方法:本研究旨在提高预测糖尿病和冠心病并存的模型的预测准确性、敏感性、特异性、F1 评分和 AUC。研究人员开发了一种先进的预测模型,将 XGBoost 与 SHAP(SHapley Additive exPlanations)相结合进行特征分析。通过比较特征选择、超参数优化和计算效率分析,确定了模型性能的最佳条件。使用独立数据集进行外部验证,证实了模型的稳健性和泛化能力,为其在临床实践中的潜在应用提供了支持。结果:本研究比较了随机森林(Random Forest)、LightGBM 和 XGBoost 三种模型,发现 XGBoost 在有效性和计算效率方面均表现更优。XGBoost 模型的准确率(Acc)为 0.8910,超参数调整后提高到 0.8942。使用中国山西省平阳医院和平阳医院的数据集进行外部验证,AUC 为 0.7897,显示出强大的泛化能力。通过整合 SHAP 进行可解释性分析,研究确定了胆红素水平、嗜碱性粒细胞计数、胆固醇水平和年龄是预测 2 型糖尿病(T2DM)和冠心病(CHD)并存的关键特征。这些发现与 XGBoost 算法确定的特征重要性排名完全一致。该模型在外部验证中 AUC 为 0.7879,具有中等预测性能和实际可解释性,在资源有限的环境中,对提高 T2DM-CHD 共病的诊断效率具有潜在价值。然而,其临床应用还需要在不同人群中进一步验证。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号