基于门控 Swin-Transformer 多尺度特征融合的婴儿先天性心脏病诊断与分类:为早期筛查带来新希望

【字体: 时间:2025年05月06日 来源:Biomedical Signal Processing and Control 4.9

编辑推荐:

  先天性心脏病(CHD)严重威胁婴儿健康,早期诊断至关重要。研究人员开展基于门控 Swin-Transformer 多尺度特征融合算法的研究,在自建数据集上六分类准确率达 96.66%,为偏远地区 CHD 初筛提供有效辅助。

  在生命的长河中,婴儿期是最为脆弱且关键的阶段,而先天性心脏病(Congenital Heart Disease,CHD)就像潜伏在黑暗中的 “杀手”,悄然威胁着无数小生命的健康。CHD 是胎儿时期心脏和大血管发育异常导致的心血管畸形,在所有先天性出生缺陷中占比近三分之一,发病率约为 0.8%。到 2017 年,它已跻身婴儿死亡原因的前八位,尤其是 1 岁以下的婴儿,一旦患上复杂或重症 CHD 且未得到及时治疗,生存率极低。
目前,听诊是筛查 CHD 的重要手段,但 CHD 的异质性使得不同患者的心音表现差异巨大,听诊结果高度依赖医生的专业水平,主观性强。对于新生儿和小婴儿,听诊难度大且效果不佳。在机器学习蓬勃发展的时代,利用其分析婴儿心音诊断 CHD 成为必然趋势。然而,现有研究大多聚焦于较宽泛的年龄段,缺乏针对 0 - 3 岁婴儿这一关键群体的研究,且多为二分类研究,难以区分 CHD 的常见类型,无法满足临床需求。

为了填补这些研究空白,云南大学和阜外云南心血管病医院的研究人员展开了深入探索。他们提出了一种基于门控 Swin-Transformer(Gated Swin-Transformer,G-Swin-T)多尺度特征融合的算法,旨在实现婴儿 CHD 的多分类准确诊断。研究成果发表在《Biomedical Signal Processing and Control》上,为 CHD 的早期诊断带来了新的曙光。

研究人员在这项研究中主要运用了以下几种关键技术方法:首先,在数据处理阶段,采用了两种数据增强方法,即 SMOTE( Synthetic Minority Over-sampling Technique)和 SpecAugment。SMOTE 直接增强原始心音记录,增加样本数量;SpecAugment 通过在时频方向随机掩蔽增强对数频谱图,提高模型的鲁棒性。其次,构建了 G-Swin-T 多尺度特征融合分类算法,其中门控单元(Gating Unit)可自适应调整权重控制信号流,多尺度特征融合单元则将 Swin-Transformer 分层结构提取的不同尺度特征进行独特融合。此外,在模型训练时,将熵正则化(Entropy Regularization)创新性地融入损失函数,并基于 esc-50 数据集进行迁移学习(Transfer Learning),在微调阶段巧妙设置层学习率(Layer-wise Learning Rate) 。研究数据来源于阜外云南心血管病医院,经超声心动图确诊,包含 423 名 0 - 3 岁婴儿的心音数据。

研究结果


  1. 数据集构建:研究人员从阜外云南心血管病医院收集数据,构建了包含 423 名 0 - 3 岁婴儿的自建数据集。数据采集自五个心音听诊点,采样频率为 5000Hz,去除了质量不佳的信号。通过对这些数据的分析,为后续研究奠定了坚实基础。
  2. 模型评估指标:实验中,训练集和测试集按 8:2 划分,并引入准确率(Accuracy,Acc)、精确率(Precision,P)、召回率(Recall,R)和 F1值作为分类效果的评估指标。这些指标能够全面、准确地反映模型的性能。
  3. 模型分类精度:在自建数据集上,该算法对六种类型(室间隔缺损(Ventricular Septal Defect,VSD)、房间隔缺损(Atrial Septal Defect,ASD)、动脉导管未闭(Patent Ductus Arteriosus,PDA)、肺动脉高压(Pulmonary Arterial Hypertension,PAH)、其他类型 CHD、正常)的分类准确率达到 96.66%。在公开的 ZCHSound 高质量数据集(包含 941 名儿童)上,五分类(VSD、ASD、PDA、卵圆孔未闭(Patent Foramen Ovale,PFO)、正常)准确率为 96.62%;在低质量数据集(包含 318 名新生儿)上,准确率为 85.92%,相较于原始研究有显著提升。

研究结论与讨论


研究人员成功提出基于 G-Swin-T 多尺度特征融合的算法,有效解决了婴儿 CHD 多分类的难题,在不同数据集上都展现出较高的准确率。该研究的创新点显著,不仅聚焦于 0 - 3 岁这一特殊年龄段,还通过多种创新方法提升了模型性能。数据增强方法解决了数据不平衡问题并增强了模型鲁棒性;G-Swin-T 多尺度特征融合算法充分利用了 Swin-Transformer 强大的特征提取能力,同时避免信息丢失;熵正则化和迁移学习的应用提高了分类性能并减少训练时间。

这项研究意义重大,为临床医生尤其是偏远地区的医生提供了一种有效的 CHD 辅助诊断工具。它能够在早期筛查中帮助医生更准确地识别 CHD 类型,为及时干预和治疗争取宝贵时间,有望降低婴儿因 CHD 导致的死亡率,改善患儿的预后。未来,随着研究的不断深入,该算法有望进一步优化,在更大规模的数据集上进行验证,并与其他诊断方法相结合,为 CHD 的诊断和治疗带来更多突破,让更多家庭摆脱 CHD 的阴霾,迎接健康幸福的未来。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号