经典与自动化机器学习模型 “对决”:心血管疾病早期预测的探索之旅

【字体: 时间:2025年05月13日 来源:Computers in Biology and Medicine 7.0

编辑推荐:

  心血管疾病是全球主要致死因素之一,早期诊断至关重要。研究人员对比经典机器学习(ClassicML)和自动化机器学习(AutoML)模型在心血管疾病早期预测中的表现。结果显示 AutoML 并非总是更优,合适的特征提取、数据平衡技术和模型组合才能取得最佳效果,为疾病诊断提供新方法。

  
心血管疾病如同隐藏在人体中的 “定时炸弹”,时刻威胁着人们的生命健康。在全球范围内,心血管疾病种类繁多,影响着心脏结构和血管系统,每天都有大量患者因各类心脏相关问题离世。像动脉粥样硬化这类病症,很可能引发冠心病等常见心脏疾病,而肥胖、高血压、高血糖以及过量饮酒等生活方式相关因素,更是成为诱发心脏病的主要风险因素。目前,传统检测心血管疾病的方法,如身体检查、家族病史询问、血管造影、心电图、超声检查和血液检测等,虽然在一定程度上能发挥作用,但在早期精准诊断方面仍存在不足。随着大数据分析在医疗领域的广泛应用,经典机器学习(ClassicML)和自动化机器学习(AutoML)技术为心血管疾病的诊断带来了新的希望,然而,两者在实际应用中的表现究竟如何,成为亟待探索的问题。

为了深入了解 ClassicML 和 AutoML 在心血管疾病早期预测中的能力,来自 Kastamonu University Kastamonu Vocational School(卡斯托莫努大学卡斯托莫努职业学校)的研究人员 Serbun Ufuk De?er 展开了一项研究,该研究成果发表在《Computers in Biology and Medicine》上。研究旨在对比不同场景下,结合特征工程和平衡技术的 ClassicML 和 AutoML 模型,探索哪种模型在以患者为中心的心血管疾病早期预测系统的开发和实施中更具优势。

研究人员主要运用了以下关键技术方法:首先,选用来自瑞士、匈牙利、克利夫兰和长滩退伍军人事务部大学的联合数据集,该数据集包含 14 个主要特征,研究中选取其中 12 个特征用于分析个体心脏病发作情况;其次,采用相关性分析这一统计方法,探究变量之间的关联、方向和强度;最后,运用 9 种传统机器学习算法和 7 种自动化机器学习算法进行模型构建和分析,以准确率为主要衡量指标,同时结合 F1 分数、精度和召回率结果来验证分类问题的结果。

描述数据集


许多数据集可用于心脏病或心脏病发作预测研究。在学术研究中,IEEE、Kaggle、加州大学欧文分校(UCI)等资源较为常用,部分数据集免费开放,有些则需要申请或付费获取。本研究使用的克利夫兰心脏病数据集和 Statlog(Heart)数据集是 UCI 提供的少数开放获取的心脏病数据集。

分析结果


通过相关性分析发现,对输出影响最大的变量是斜率(slope)、运动诱发心绞痛(exang)和胸痛类型(cp)。变量间相关性最高的分别是(slope,oldpeak)、(slope,exang)和(cp,exang)。这表明 slope、exang 和 cp 在心脏病预测分析中具有重要作用。

讨论


机器学习作为人工智能的基本范式,能够构建和改进数学模型,帮助人们更好地理解数据。在疾病检测和干预方面,利用机器学习构建强大的预测模型至关重要,从 20 世纪 90 年代起,计算机就开始应用于疾病检测领域。

结论


数据科学是一个跨学科领域,融合数学、统计学和软件等多学科知识,能够解决复杂问题,将数据转化为有价值的信息,基于数据集进行预测并学习数据的内在结构和功能。在医疗保健等众多领域,数据科学发挥着重要作用。

研究意义总结


本研究表明,AutoML 工具的性能并非一定优于传统机器学习方法。有效的特征提取,结合合适的数据平衡技术和恰当的机器学习模型,才能实现最佳性能。这一结论为心血管疾病的早期诊断提供了更科学的方法选择依据,有助于医疗专业人员制定更准确、可靠的诊断方案,提高心血管疾病的早期预测水平,进而为患者争取更多的治疗时间,降低心血管疾病的死亡率,在心血管疾病防治领域具有重要的理论和实践意义。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号