基于注意力门控卷积神经网络(Attention-Gated CNN)和离散小波变换(Discrete Wavelet Transform)的集成框架用于脑出血分类

《Neuroscience Informatics》:Attention-Gated CNN and Discrete Wavelet Transform based Ensemble Framework for Brain Hemorrhage Classification

【字体: 时间:2025年11月16日 来源:Neuroscience Informatics CS11.7

编辑推荐:

  脑出血分类的集成框架研究提出结合注意力门控2D CNN和离散小波变换(DWT)的模型,有效区分EDH与SDH等亚型,在RSNA、CQ500和GMC数据集上显著优于基线方法,AUC达0.986,灵敏度与特异度均超过0.94。

  脑出血,或称为颅内出血(ICH),是一种需要快速诊断的严重医疗状况。目前的卷积神经网络(CNN)模型在区分类似出血亚型,如硬膜外出血(EDH)和硬膜下出血(SDH)时,常常因为缺乏对特定空间特征的识别而遇到困难。本研究旨在开发一个稳健的分类框架,以解决这一问题。我们提出了一种结合两种互补模型的集成框架。第一个模型是注意力门控的2D CNN,其设计目的是突出显示细微的出血区域。第二个模型是多级离散小波变换(DWT)模型,它通过分析图像的频率域来捕捉3D脑体积中的更深层次的上下文和纹理信息。该集成模型在RSNA、CQ500和一个新采集的GMC临床数据集上进行了评估。实证研究表明,我们的模型在标准评估指标上持续优于现有最先进的方法,包括准确率、宏平均AUC-ROC、特异性和敏感度以及F1分数。这种新颖的集成方法通过提供更全面的特征表示,显著提高了ICH分类的准确率和稳健性,尤其是在区分具有挑战性的EDH和SDH亚型时表现突出。

在临床环境中,诊断需要在时间紧迫的场景中进行,而手动审查脑CT图像对于专家来说往往面临巨大挑战,因为图像切片数量庞大,某些出血的细微表现可能被误认为脑脊液(CSF)或其他组织,可能导致致命的延误。为了解决这一问题,近年来许多基于深度学习的方法被用于ICH分类,利用RSNA、CQ500等公开数据集。然而,应用这些方法的主要困难在于CT扫描的固有3D性质。放射科医生在诊断过程中通过查看3D体积的各个切片来评估出血的类型和范围,每个切片可能包含一种或多种出血类型。因此,大多数技术开发了基于切片的模型,而不是整个CT体积,使用标准的CNN如ResNet或ResNeXt来处理2D图像。虽然使用3D CNN模型可能更实际,但它们在切片级别定位ICH时存在局限,并且计算成本较高。因此,针对ICH分类的主要研究方向是使用混合模型,其中2D CNN框架用于特征提取,随后通过序列模型如长短期记忆网络(LSTM)或门控循环单元(GRU)网络来捕获相邻切片之间的上下文信息。这些模型在与3D-CNN模型的比较中表现相对较好。此外,基于变压器的架构也逐渐被用于ICH分类。尽管3D CNN模型和变压器在处理3D扫描时有效,但它们计算成本高且在某些情况下效果不佳,而混合模型计算效率更高但可能在识别细微出血区域时缺乏鲁棒性。因此,目前文献中的许多技术未能正确识别EDH和SDH,这两个亚型由于靠近颅骨而具有细微差异。

为了解决这些问题,本文提出了一种集成框架,结合注意力门控的2D CNN和基于频率域分析的DWT模型。该框架的注意力门控2D CNN模型借鉴了注意力U-Net模型,该模型已被证明在CT切片中有效突出临床相关区域。使用这一模型的直觉是特别关注识别脑体积中的血液瘀斑,尤其是在罕见的ICH类型如EDH和SDH中。框架的另一个组成部分是多级频率分析的DWT模型,该模型通过DWT算法进行多分辨率分析。初始阶段,它使用一个卷积块处理3通道输入,以维持空间分辨率。随后,使用了b个堆叠的DWT块,这些块将预处理的输入切片分解为多个频率子带,从而捕捉到粗结构和细纹理信息,以区分不同ICH类型之间的细微差异。DWT在类似应用中已显示出良好的效果,因此被用于本研究。DWT块的数量在实验中固定。经过所有DWT块处理后,特征通过最终的特征细化步骤进行优化,即使用1×1卷积,也就是多层感知机(MLP),然后通过自适应平均池化来聚合空间信息,最后通过一个全连接层获取输出logits。单个DWT块的架构如图3所示。

最终预测通过一种后期融合的集成策略生成。这种方法利用注意力门控CNN和DWT模型所学习的多样化特征表示。具体步骤如下:首先,对于给定的输入切片,分别从注意力门控CNN和DWT模型生成预测结果,形式为logits。接着,通过简单的平均将这两个logit向量合并,形成一个集成的logit向量。最后,将这个集成的logit向量通过sigmoid函数转换为最终的类别概率,用于评估。这种平均技术赋予两个模型同等的重要性,并已被证明比使用单一模型能有效提高泛化能力和减少方差。

为了应对RSNA、CQ500和GMC数据集中固有的显著类别不平衡问题,我们采用了一种类别加权的二元交叉熵(BCE)损失函数。这种方法防止模型偏向多数(负)类别,通过为代表性不足的正类别分配更高的惩罚来实现。对于每个出血亚型c,其权重wc是根据训练集中该类别的频率计算得出的。这样可以有效平衡每个类别的贡献,从而实现更稳健和临床相关的模型性能。

在实验评估方面,我们使用了两个公开数据集:RSNA 2019脑CT出血挑战数据集和CQ500数据集,以及一个新采集的GMC数据集。RSNA数据集用于训练我们的模型和后续的最新方法,而CQ500和GMC数据集则作为测试集,用于性能评估,因为它们规模较小,适合训练个体模型。GMC数据集是为了在另一种临床环境中严格评估我们的模型而专门采集的。由三位放射科医生组成的团队进行了细致的切片级注释。对于每个病例,专家们通过专门的医学影像查看器进行讨论,检查CT体积的每个切片以确认出血的存在并标注特定的亚型,任何模糊的发现都通过共识评审来解决,以确保诊断的准确性。

在结果分析方面,我们比较了我们的集成框架与四种现有的先进深度学习方法在ICH分类领域的表现,包括2D CNN结合双向GRU(Bi-GRU)、2D CNN结合双向LSTM(Bi-LSTM)、深度多尺度网络和3D CNN,基于ROC-AUC、特异性、敏感性和准确率等标准评估指标。所有模型都在相同的训练和测试数据集上进行了评估,以确保公平和直接的比较。结果显示,我们的集成方法在三个测试数据集上显著优于所有基线方法。在RSNA数据集上,我们的模型达到了0.986的宏平均ROC-AUC和0.982的准确率。这一趋势在外部验证数据集上也持续存在,我们的模型在CQ500数据集上(ROC-AUC 0.971)和GMC数据集上(ROC-AUC 0.950)都表现出色。尽管基线模型表现良好,但我们的集成方法在敏感性和特异性之间提供了更好的平衡,表明其更稳健和具有泛化能力。

为了更深入地评估模型的性能,我们进行了全面的统计分析。首先,使用DeLong测试来确定每个出血亚型的ROC-AUC是否显著高于临床相关的基线。此外,我们通过预期校准误差(ECE)评估模型的校准情况。进一步的分析见第3.5节。我们还评估了各个组成部分的性能,即注意力门控CNN和DWT模型,以及集成版本,通过表2。这验证了我们方法的协同效应,即注意力门控CNN的空间特征提取和DWT模型的频率域分析提供了稳健的信息,从而实现有用预测。表2中的详细分析表明,即使在单个类别上,注意力门控CNN和DWT模型的表现也接近我们提出的模型。

为了进一步验证模型的性能,我们对RSNA数据集进行了消融研究,结果见表4。我们从标准的ResNeXt-101作为基线空间特征提取器开始,然后逐步增加DWT模型的复杂性,通过添加更多的WaveMix块来展示更深层次的频率域分析如何提高性能。随后,我们为ResNeXt主干添加了注意力机制(AG-CNN),这显著提升了标准CNN的性能。最终,我们结合优化的DWT模型和AG-CNN,实现了所有指标上的最高分数。这种系统的评估确认了注意力机制和多分辨率频率分析的互补性,以及它们的融合对模型卓越性能的重要性。

为了统计验证模型的判别能力,我们使用了DeLong测试,将面积下ROC曲线(AUC)与一个强基线进行比较。零假设(H0)是我们的模型的AUC等于或小于其他基线模型,而备择假设(H1)是我们的模型的AUC大于竞争方法。p值小于0.05表明我们的模型性能具有统计显著性。这种测试特别适合,因为它考虑了由同一组病例生成的ROC曲线的相关性。一个临床有用的模型不仅要有判别能力,还必须经过良好校准,即其预测的概率应反映事件的真实可能性。我们通过预期校准误差(ECE)评估了校准情况,这通常用于量化预测置信度与实际准确率之间的对齐情况。我们使用了自适应分箱技术,对RSNA、CQ500和GMC数据集进行了处理,以在[0,1]置信度范围内更细致地检测校准误差,特别是在决策边界附近,不确定性量化是常见的。使用较少的分箱可能过于简化校准曲线,引入偏差,而过多的分箱可能导致过拟合,引入方差。因此,使用自适应分箱创建了样本数相等的分箱,而不是宽度相等,确保了每个分箱的准确率估计更加稳定,提供了更可靠的总体校准度。较低的ECE值表明模型的置信度更高,因此是期望的。我们的统计验证结果见表5。在所有数据集上,我们的框架相比现有技术表现出统计显著的改进,同时实现了低ECE值,表明其具有良好的校准性和临床价值。

结论部分指出,本文引入了一种新颖的集成模型,结合了注意力门控的2D CNN和DWT网络的协同优势。这种集成方法在公开数据集上表现出色,展示了其价值和有效性。模型的结果表明,结合注意力机制和CT图像的多分辨率分析,能够为ICH分类提供更全面的特征表示。尽管提出的框架表现良好,但在临床环境中,即使是一个错误的分类也可能产生重大影响。因此,我们计划通过在其他临床环境中实施该方法,进一步改进和验证其有效性。此外,该模型还可以应用于其他医学影像任务,为未来的医疗诊断提供支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号