基于可解释机器学习的肿瘤心电图诊断新策略:一项外部验证研究

【字体: 时间:2025年07月27日 来源:Cardio-Oncology 3.2

编辑推荐:

  本研究针对肿瘤早期诊断面临的侵入性、高成本和资源限制等挑战,创新性地利用心电图(ECG)信号结合可解释人工智能(XAI)技术,开发了基于XGBoost算法的诊断模型。研究通过MIMIC-IV-ECG和ECG-VIEW-II两大数据库验证,实现了对呼吸系统(C34)、泌尿系统(C61)等多类肿瘤的高精度诊断(AUROC 0.738-0.879),并通过Shapley值分析揭示了QT间期、QRS波等关键ECG特征与肿瘤的关联,为非侵入性肿瘤筛查提供了新思路。

  

在当今医学领域,肿瘤仍然是全球死亡率最高的疾病之一。据统计,仅2024年美国就将新增超过200万肿瘤病例,造成60多万人死亡。尽管诊疗技术不断进步,但现有诊断方法如影像学检查、组织活检等存在明显局限——它们往往具有侵入性、价格昂贵且在资源有限地区难以普及。这导致许多肿瘤患者在确诊时已处于晚期,严重影响了治疗效果和生存率。面对这一严峻挑战,医学界亟需开发更便捷、经济的早期筛查手段。

传统心电图(ECG)作为心血管疾病诊断的基石,近年来其应用范围正不断拓展。研究表明,ECG信号不仅能反映心脏电活动,还能捕捉全身生理状态的微妙变化,包括实验室指标异常、急诊患者病情恶化等非心脏疾病信号。这种"跨界"应用的背后,是肿瘤与心血管系统复杂的相互作用机制——肿瘤可通过直接侵犯、副肿瘤综合征或系统性炎症等途径引发心电改变,而化疗等肿瘤治疗手段又常导致心脏毒性反应。这些现象为利用ECG进行肿瘤诊断提供了理论可能。

来自Carl von Ossietzky Universitat Oldenburg的研究团队开展了这项开创性研究。他们构建了一个结合树状机器学习模型与Shapley值解释技术的诊断流程,通过分析ECG特征与人口统计学数据的关联来预测肿瘤。研究采用MIMIC-IV-ECG数据库进行模型训练和内部验证,并利用韩国ECG-VIEW-II数据库进行外部验证,确保了结果的可靠性和普适性。

研究团队主要采用了三种关键技术方法:1)基于XGBoost的树状机器学习模型,用于建立ECG特征与肿瘤诊断间的非线性关系;2)Shapley值分析,用于解释模型预测并识别关键ECG特征;3)严格的验证流程,包括内部测试集验证和独立外部队列验证。所有实验均在配备100个CPU核心的高性能计算平台上完成,确保了大规模数据分析的效率。

预测性能

模型在多种肿瘤诊断中展现出卓越的判别能力。呼吸系统肿瘤中,下叶肺癌(C343)诊断AUROC达0.855;泌尿系统肿瘤中,膀胱癌(C679)诊断AUROC为0.833;消化系统肿瘤中,胆道癌(C24)诊断AUROC达0.837。特别值得注意的是,模型能区分良恶性肿瘤,如前列腺癌(C61)与良性前列腺增生(N40)的鉴别诊断AUROC分别为0.756和0.749。

可解释性分析

通过Shapley值揭示了影响预测的关键因素:

  • 年龄是最重要特征,老年患者对呼吸、泌尿和消化系统肿瘤预测贡献更大
  • QT间期缩短(加速心室复极)对多数肿瘤预测有正向贡献
  • 男性性别在多数肿瘤中比女性贡献更大
  • 呼吸系统肿瘤中,RR间期缩短和QRS电轴改变是关键ECG特征
  • 泌尿系统肿瘤中,QRS时限延长和电轴左偏具有诊断价值

临床效用

决策曲线分析显示,该模型在临床相关概率阈值范围内比"全筛查"或"不筛查"策略具有更高的净收益。校准曲线表明模型预测概率与实际风险高度一致,尤其在低患病率情况下仍保持可靠。

这项研究开创性地证实了ECG信号在肿瘤诊断中的应用价值。通过可解释机器学习方法,不仅实现了多系统肿瘤的高精度识别,还揭示了心血管系统与肿瘤相互作用的生物标志物。这种非侵入性、低成本的方法特别适合资源有限地区的筛查应用,有望作为现有诊断体系的补充工具。尽管存在治疗相关混杂因素等局限,但研究为肿瘤早期检测提供了新思路,对推动"心脏-肿瘤"交叉学科发展和个性化诊疗具有重要意义。未来研究可进一步探索ECG原始波形分析、因果推断等方法,以提升诊断效能并阐明潜在机制。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号