综述:机器学习算法在心脏病诊断中的应用:系统性综述

【字体: 时间:2025年05月27日 来源:Current Problems in Cardiology 3.0

编辑推荐:

  这篇综述系统评估了2013-2024年间24项研究,聚焦监督式机器学习算法(如决策树DT、逻辑回归LR、随机森林RF等)在心脏病预测与诊断中的应用。研究揭示DT以最高99.2%的准确率成为最常用算法,同时探讨了数据预处理(如SMOTE平衡技术)和模型评估指标(准确率/特异性)。文献通过PRISMA框架筛选,强调算法在解决医疗数据冗余性和提升早期诊断中的潜力,为未来研究提供方向性指引。

  

背景

心脏作为维持生命的关键器官,其功能障碍会引发全身系统紊乱。全球数据显示,心血管疾病(CVD)是非洲30岁以上人群、欧洲45%死亡病例及亚洲35%死亡的主因。传统诊断方法存在成本高、准确性低的问题,而机器学习(ML)通过分析临床数据(如克利夫兰数据集)揭示潜在模式,为早期干预提供新思路。

方法

研究采用PRISMA 2020标准,从Scopus、PubMed等6大数据库筛选2,824篇文献,最终纳入24项符合条件的研究。纳入标准包括:2013-2024年英文论文、聚焦监督学习算法(如DT/LR/RF)、使用心脏病预测模型。通过PROBAST工具评估偏倚风险,58%研究显示低风险。

结果

决策树(DT):在15项研究中表现突出,最高准确率达99.2%。ID3和CART算法能直观展示关键风险因素(如血压、胆固醇),但存在过拟合风险。
逻辑回归(LR):适用于线性分类,在克利夫兰数据集(303例)中实现92.3%准确率,优势在于解释性强。
朴素贝叶斯(NB):基于贝叶斯定理,对独立特征数据集(如Statlog数据)效率高,最高精度87.91%。
随机森林(RF):通过集成学习降低过拟合,在Framingham数据(23,128例)中达99.49%准确率,但需调整超参数。
人工神经网络(ANN):对非线性关系建模能力强,在印度2,200例患者数据中实现92.21%准确率,但依赖大量训练数据。

讨论

DT的透明性使其成为临床决策支持的首选,而RF和ANN在复杂数据中潜力待挖掘。研究局限性包括:

  1. 数据源集中于UCI公开数据集,可能缺乏临床多样性;
  2. 部分研究未充分处理缺失数据(如PROBAST评估中33%研究分析域偏倚不明确)。未来需结合多模态数据(如影像学)和强化学习优化模型。

结论

当前证据支持DT和LR在心脏病预测中的主导地位,但需通过特征工程(如Chi-square筛选)和混合模型(如DT+ANN)进一步提升性能。研究为开发低成本、高精度的诊断工具提供了算法选择框架。

局限性与展望

仅纳入英文文献可能引入语种偏倚,且未涵盖深度学习最新进展。建议后续研究探索:

  1. 跨种族数据验证;
  2. 实时动态预测系统;
  3. 算法在移动医疗中的应用。

(注:全文严格基于原文数据,未添加非引用结论)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号