XAI-HD:一种融合机器学习、深度学习与可解释人工智能的心脏病检测框架及其临床意义

《ARTIFICIAL INTELLIGENCE REVIEW》:XAI-HD: an explainable artificial intelligence framework for heart disease detection

【字体: 时间:2025年10月18日 来源:ARTIFICIAL INTELLIGENCE REVIEW 13.9

编辑推荐:

  本研究针对心脏病早期诊断中AI模型透明度不足、数据类别不平衡等关键问题,提出了XAI-HD混合框架。通过集成多种数据平衡技术(如SMOTEENN)和可解释AI工具(SHAP、LIME),该研究在CHD、FHD和SHD数据集上实现了最高100%的准确率,显著提升了模型的可信度和临床适用性,为心血管疾病智能诊断提供了创新性解决方案。

  
心血管疾病(CVD)是全球首要死因,每年导致约1790万人死亡,占全球总死亡人数的32%。传统风险评估模型如弗拉明汉风险评分(FRS)依赖线性假设,难以捕捉风险因素间复杂的非线性关系,且面临数据缺失、类别不平衡等挑战。虽然人工智能(AI)技术在心脏病预测中展现出高准确性,但其"黑箱"特性严重制约了临床医生的信任度和采纳意愿。
为破解这一难题,发表在《Artificial Intelligence Review》上的研究提出了XAI-HD框架,创新性地融合了机器学习(ML)、深度学习(DL)和可解释人工智能(XAI)技术。该研究系统评估了三种公开数据集(克利夫兰心脏病数据集CHD、弗拉明汉心脏病数据集FHD和瑞士心脏病数据集SHD),通过对比七种算法和六种数据平衡方法,发现结合SMOTEENN平衡技术的多层感知器(MLP)模型表现最优,在CHD和SHD数据集上达到100%的准确率,在FHD数据集上也达到92.71%的准确率。更重要的是,通过SHAP和LIME等可解释性技术,医生能够直观理解模型决策依据,如胆固醇水平、血压等关键特征的影响程度,极大增强了临床应用的可行性。
研究采用的核心技术方法包括:基于Z-score归一化的数据预处理、六种数据平衡策略(OSS、NCR、SMOTEN、ADASYN、SMOTETomek和SMOTEENN)、七种机器学习与深度学习模型(RUSBoostClassifier、BalancedBaggingClassifier、Logistic Regression、MLP、LightGBM、CNN和Multi-Head Attention)的性能比较,以及SHAP和LIME驱动的特征重要性分析(FIA)。所有实验均采用分层5折交叉验证,确保结果统计显著性。
性能分析结果
在CHD数据集上,SMOTEENN+MLP组合实现了全部评估指标的满分表现,包括准确率、精确度、召回率、F1-score等均为100%。相比之下,传统逻辑回归(LRC)和卷积神经网络(CNN)分别达到94.87%和92.31%的准确率。统计检验(Wilcoxon符号秩检验p值=0.016)证实了性能提升的显著性。
在FHD数据集上,MLP模型在SMOTEENN平衡后表现最佳,准确率达92.71%,精确度92.79%,F1-score 92.62%。LightGBM和BalancedBaggingClassifier分别以91.86%和91.1%的准确率紧随其后。该数据集上的结果突显了混合平衡策略在处理现实世界医疗数据不平衡问题上的有效性。
在SHD数据集上,SMOTEENN+MLP再次实现完美分类(100%准确率),而逻辑回归(LRC)和LightGBM(LGB)分别达到97.5%的准确率。值得注意的是,该数据集原始分布极不平衡(正常类仅8例,疾病类115例),SMOTEENN技术有效缓解了类别偏差问题。
可解释性分析
SHAP分析揭示了不同数据集中关键预测特征的差异:在CHD数据中,静息血压(trestbps)、地中海贫血(thal)和性别(sex)对正常分类贡献最大;而在FHD数据中,年龄、高血压病史和BMI成为主要影响因素。LIME提供的局部解释则展示了特定患者案例中特征贡献度,如胸痛类型(cp)和运动诱发心绞痛(exang)对个体预测结果的具体影响。
计算复杂度分析
MLP模型在保持高精度的同时展现出良好的计算效率:在CHD数据集上总时间3.544秒,内存占用0.402MB;在SHD数据集上总时间3.768秒,内存0.634MB。相比而言,多头注意力(MHA)模型在FHD数据集上需要43.893秒和7.653MB内存,表明XAI-HD更适合临床实时应用场景。
讨论与结论
XAI-HD框架通过系统解决数据质量、类别不平衡和模型可解释性三大挑战,实现了心脏病预测领域的多重突破。首先,SMOTEENN等混合平衡技术有效缓解了医疗数据中常见的类别不平衡问题;其次,MLP等深度学习模型展现出超越传统方法的模式识别能力;最重要的是,SHAP和LIME提供的透明化解释搭建了AI技术与临床实践之间的信任桥梁。
与现有研究相比,XAI-HD在保持高精度的同时实现了更好的泛化能力和临床可解释性。例如,在CHD数据集上,其性能优于Paul(2024c)提出的集成学习(98.2%)和Shrivastava等(2023)的CNN-BiLSTM混合模型(96.66%)。在瑞士数据集上,其100%的准确率显著超越Mesquita和Marques(2024)报告的随机森林模型(95.65%)。
该研究的临床意义主要体现在三个方面:一是通过可解释AI增强医生对模型决策的理解,促进AI辅助诊断的临床采纳;二是提供自动化的风险分层工具,可用于电子健康记录(EHR)系统集成;三是为个性化治疗规划提供数据驱动支持。未来研究方向包括扩展至多模态数据(如ECG信号、遗传标记)以及通过联邦学习实现跨机构协作,同时保障患者隐私。
总之,XAI-HD框架成功弥合了AI技术与临床需求之间的差距,为心脏病早期检测提供了准确、透明且可部署的解决方案,标志着可解释AI在心血管医疗领域应用的重要进展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号