综述:人工智能方法在心血管疾病检测中的全面综述:最新进展与未来挑战

【字体: 时间:2025年10月16日 来源:MethodsX 1.9

编辑推荐:

  本综述系统回顾了人工智能(AI)技术,特别是机器学习(ML)和深度学习(DL),在心血管疾病(CVD)检测领域的最新应用。文章详细探讨了基于电子健康记录(EHR)和心电图(ECG)等数据模态的多种ML/DL算法(如CNN、RNN、SVM、RF),分析了其在提升诊断准确性、风险分层和个性化医疗方面的潜力,并指出了数据质量、模型可解释性及多模态融合等当前挑战与未来方向。

  
心血管疾病(CVD)是全球范围内导致死亡和残疾的主要原因之一,对公共卫生构成了巨大负担。世界卫生组织(WHO)数据显示,2019年约有1790万例死亡与CVD相关。面对这一挑战,人工智能(AI)技术,特别是机器学习(ML)和深度学习(DL),为心血管疾病的早期检测、诊断和风险管理提供了革命性的工具。本综述旨在系统梳理AI方法在CVD检测中的应用现状、核心技术与未来挑战。
引言
心血管疾病涵盖了一系列影响心脏和血管的疾病,如冠状动脉疾病(CAD)、心力衰竭、心肌病和心律失常等。其风险因素包括吸烟、高血压和不良生活方式。传统的CVD诊断依赖于临床评估、实验室检查和影像学手段,如超声心动图、血管造影等。然而,这些方法往往需要大量人力且耗时。随着医疗数据的爆炸式增长,包括电子健康记录(EHR)、医学影像(如ECG、心脏MRI、CT)和可穿戴传感器数据,AI技术显示出处理这些复杂、多模态数据的巨大潜力。ML和DL算法能够从海量数据中自动学习特征和模式,从而提高诊断置信度、优化临床工作流程,并实现更精准、以患者为中心的治疗。
用于CVD检测的数据集
开发有效的AI模型依赖于高质量的数据集。用于CVD预测的数据集主要分为两类:包含临床特征的数据集和医学影像数据集。
  • 包含EHR的心脏病数据集:这类数据集通常包含患者的 demographics(如年龄、性别)、生命体征(如静息血压trestbps、血清胆固醇chol)、症状(如胸痛类型cp)和检查结果(如静息心电图结果restecg)。常用的公开数据集包括克利夫兰数据集(Cleveland dataset)、Z-Alizadeh Sani数据集、匈牙利数据集等。这些数据集规模相对较小,例如经典的克利夫兰数据集仅有303条记录。为克服数据量限制,有研究将多个数据集合并形成更全面的心脏病数据集(Heart Disease Dataset (Comprehensive)),包含720条记录和14个关键特征。
  • 影像数据集:心电图(ECG):ECG是记录心脏电活动的重要工具,在心律失常等CVD检测中至关重要。存在多个公开的ECG数据库,例如MIT-BIH心律失常数据库(MIT-BIH Arrhythmia Database),它包含47名受试者的48条双导联ECG记录,是心律失常检测和分类最常用的基准之一。其他重要数据库包括用于心房颤动检测的MIT-BIH心房颤动数据库(MIT-BIH Atrial Fibrillation Database)、用于心肌梗死研究的PTB诊断ECG数据库(PTB Diagnostic ECG Database)以及圣彼得堡INCART 12导联心律失常数据库(St. Petersburg INCART 12-Lead Arrhythmia Database)等。这些数据库在信号持续时间、导联配置和关注的特定心律失常类型上各有侧重,为训练和评估AI模型提供了丰富资源。
ML在CVD预测中的应用
ML通过从数据中学习并做出预测,为CVD风险预测提供了强大方法。ML算法大致分为监督学习(如用于分类的支持向量机SVM、随机森林RF、逻辑回归LR;用于回归的模型)、无监督学习(如聚类)和强化学习。在CVD预测中,监督学习模型应用最为广泛。
ML模型的性能很大程度上受输入数据模态的影响。这些模态包括:
  1. 1.
    结构化临床和EHR数据:包含年龄、血压、胆固醇等表格化预测因子,是最常见的输入数据。
  2. 2.
    心电图(ECG):时间序列信号数据,可用于训练深度CNN和Transformer模型,提取临床医生难以察觉的预后特征。
  3. 3.
    影像模态:如超声心动图、心脏MRI、CT血管造影。CNN可用于自动化分割、表型分析(如射血分数估计)和结局预测。
  4. 4.
    多模态融合:结合不同模态的数据(如ECG+实验室数据、影像+EHR)可以改善预测的稳健性和性能。融合策略包括后期融合(集成多个模态特异性模型)和中期融合(基于注意力的融合)。
特征选择是提升ML模型性能的关键步骤,常用方法包括统计方法(如方差分析ANOVA、相关性分析)、包装法(如递归特征消除)、嵌入法(如Lasso回归、决策树DT、随机森林RF)和降维技术(如主成分分析PCA、独立成分分析ICA)。研究表明,集成方法如随机森林(RF)以及超参数优化技术(如GridSearchCV)能显著提高模型在UCI克利夫兰等数据集上的预测准确率。然而,许多研究基于单中心、回顾性数据集,存在过拟合风险,且缺乏外部验证,限制了其临床推广性。
用于ECG分析的DL技术
DL作为ML的一个子集,利用具有多层结构的神经网络(如卷积神经网络CNN、循环神经网络RNN)自动从原始或少量预处理的数据中学习层次化特征表示,在处理高维、非结构化数据(如原始ECG信号、医学影像)方面表现出色。
  • 多层感知器(MLP):一种基础的前馈神经网络,能够学习输入特征之间的非线性关系,用于ECG分类任务。
  • 卷积神经网络(CNN):特别擅长处理具有空间或时间结构的数据。在ECG分析中,1D-CNN可直接处理一维时间序列信号,自动提取有意义的波形特征(如P波、QRS波群、T波形态),用于心律失常或心肌梗死(MI)的检测。2D-CNN则可用于处理ECG的时频变换图(如短时傅里叶变换STFT谱图)。
  • 循环神经网络(RNN):专为序列数据设计,能够捕捉时间依赖性。长短期记忆网络(LSTM)和门控循环单元(GRU)是RNN的变体,通过门控机制缓解了传统RNN的梯度消失问题,非常适合分析ECG信号中的长期依赖关系。
  • 混合模型与新兴架构:结合CNN和RNN/LSTM的混合模型(如CNN-LSTM)可以同时捕捉ECG的局部形态特征和长期时间动态。Transformer架构及其注意力机制也开始应用于ECG分析,擅长处理长序列数据。此外,生成对抗网络(GAN)可用于数据增强,以解决医疗数据中常见的类别不平衡问题。
DL模型在多项任务中展现出巨大潜力,例如使用CNN从常规12导联ECG中检测无症状左心室功能障碍、肥厚型心肌病(HCM)甚至心脏淀粉样变性等罕见疾病。这些模型有时甚至能发现人眼难以识别的诊断模式。
讨论
ML和DL模型在CVD检测中取得了显著进展。传统ML模型(如RF、SVM)在小型结构化数据集上表现良好,计算效率高且相对可解释。DL模型(如CNN、RNN)则在处理高维原始数据(如ECG信号、医学影像)方面更胜一筹,能够自动学习复杂特征,往往能达到甚至超过专家水平的准确度。
然而,该领域仍面临诸多挑战:
  1. 1.
    数据局限性与泛化能力:许多研究基于单中心、回顾性、小样本数据集,存在过拟合风险,且缺乏多中心外部验证,影响模型在真实世界中的泛化能力。
  2. 2.
    模型可解释性:尤其是DL模型,常被视为“黑箱”,其决策过程难以理解,降低了临床医生的信任度。虽然可解释性AI(XAI)技术(如SHAP、Grad-CAM)正在发展,但仍需改进。
  3. 3.
    多模态融合的挑战:整合不同来源和格式的数据(如EHR、ECG、影像)面临数据对齐、缺失值处理、模型复杂性增加等困难。
  4. 4.
    临床转化与验证:大多数研究仅报告区分度指标(如准确率、AUC),缺乏校准度、临床效用(如决策曲线分析)和跨亚组公平性的评估。前瞻性随机对照试验(RCT)对于证明AI模型在改善患者结局方面的价值至关重要。
  5. 5.
    伦理与监管:数据隐私、安全性、算法偏差以及如何将AI工具整合到现有临床工作流程中都是需要解决的现实问题。
医疗保健中多模态模型面临的挑战与未来方向
多模态融合被认为是提高CVD预测准确性和稳健性的关键。然而,其发展面临数据异构性、缺失模态处理、计算复杂度高以及可解释性差等挑战。
未来研究方向应关注:
  • 数据与基准:建立大规模、多中心、高质量的多模态数据集和社区基准。
  • 模型架构:开发更灵活、可解释的多模态融合策略(如跨模态注意力)、能处理缺失数据的模型以及心脏专用的基础模型(Foundational Models)。
  • 验证与部署:进行严格的外部验证和前瞻性试验,评估临床效用。同时,研究模型压缩和高效架构,以适应边缘设备(如可穿戴设备)上的部署。
  • 伦理与公平:确保模型决策的公平、公正和透明。
结论
ML和DL技术在心血管疾病检测领域展现出巨大潜力,为改善诊断精度、实现早期干预和个性化医疗提供了强大工具。基于ECG的分析是当前研究热点,CNN、RNN及其混合模型取得了显著成果。然而,要实现广泛的临床转化,必须克服数据质量、模型可解释性、泛化能力和多模态集成等挑战。未来的研究需要朝着更严谨的验证、以临床价值为导向以及负责任地部署AI技术的方向发展,最终目标是提升全球心血管健康水平。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号