超分辨率超声成像技术能够检测出2型糖尿病患者海马区的微血管变化
《Biomedical Signal Processing and Control》:Super-Resolution ultrasound imaging identifies hippocampal microvascular changes in patients with type 2 diabetes
【字体:
大
中
小
】
时间:2025年11月07日
来源:Biomedical Signal Processing and Control 4.9
编辑推荐:
肝肿瘤分割模型FAFilTransNet提出频率域全局建模、自适应多尺度特征融合与边界增强模块,有效解决低对比度及模糊边界问题,在LiTS17和3Dircadb数据集上Dice系数达85.12%和85.49%。
肝癌的准确分割对于医学影像中的诊断和治疗规划至关重要,是许多后续医疗任务的基础。然而,由于组织间对比度低、病灶形态复杂以及边界模糊等问题,实现精确的病灶勾画仍然面临挑战。现有的方法通常针对特定问题进行优化,例如长距离依赖建模、边界细化或多尺度适应,但往往缺乏统一和全面的框架。为了解决这些问题,本文提出了一种名为Feature Adaptive Filtering Transformer Network(FAFilTransNet)的新方法,该方法将全局频率建模、边缘增强和多尺度融合整合到一个统一的架构中。FAFilTransNet包含一个双分支编码器,该编码器结合了卷积层提取的局部空间特征和通过全局滤波器Transformer编码器捕捉的全局上下文表示。该编码器在频率域中运行,能够捕捉短距离和长距离的空间依赖关系,从而有助于区分对比度低且边界模糊的病灶。为了减少语义差距并保留诊断细节,我们引入了一个特征自适应残差模块,该模块可以在不同尺度上自适应地融合层次化特征。此外,设计了一个滤波激发模块,以强调与病灶相关的频率成分,使模型能够通过关注信息丰富的空间区域实现精确的边缘细化。在LiTS17和3Dircadb等三个公开数据集上的广泛实验表明,FAFilTransNet在这些数据集上取得了优越的性能,分别达到了85.12%和85.49%的Dice系数。消融实验验证了每个模块对整体性能的贡献。这些结果表明,FAFilTransNet在应对低对比度、模糊边界以及肿瘤大小和形态变化等挑战方面具有强大的鲁棒性和广泛的应用性。该方法的实现可在GitHub上找到:https://github.com/HUI623/FAFilTransNet。
准确的肝肿瘤分割对于医学影像中的有效诊断和治疗规划具有重要意义。全球范围内,肝癌的发病率排名第六,死亡率位居第三[1]。CT扫描在揭示肝细胞癌的影像特征方面表现出色[2],为病灶的大小、形态和位置提供了关键信息。因此,图像分割已成为提高诊断准确性和效率不可或缺的技术。目前,肝肿瘤分割的黄金标准依赖于经验丰富的放射科医生手动标注(如图1中的绿色轮廓)。然而,这一过程耗时、费力,并且容易受到不同观察者之间差异的影响,如图1中红色框内所示的遗漏病灶。此外,低组织对比度、模糊的边界以及肿瘤大小和形态的显著变化进一步增加了分割任务的难度。如图1所示,模糊的外观和小病灶(例如红色箭头)常常导致分割不足,即使是在公开的专家标注数据集中也是如此,这凸显了开发稳健自动化方法的迫切需求。
为了解决上述挑战,基于深度学习的分割方法迅速发展。早期的卷积神经网络(CNNs)如全卷积网络(FCNs)[4]和U-Net[5]为医学图像分割奠定了基础。然而,传统的CNNs由于其局部感受野的限制,难以建模长距离依赖关系——这是准确分割的关键,尤其是在病灶边界界定方面。此外,编码器-解码器架构在多次下采样过程中容易丢失空间细节,而上采样路径往往忽略低级的细粒度特征,从而阻碍了精确定位和边界定义。为克服这些局限性,一些基于U-Net的变体被提出,如SegNet[6]、Attention U-Net[7]、CE-Net[8]和Y-Net[9],它们通过跳接连接和注意力机制增强了局部特征提取。Shui等人[10]通过多尺度选择性特征融合和边缘引导注意力解决了肿瘤形状变化和模糊边界的问题。一类方法专注于特征增强策略,例如MS-UNet[11]采用了高级特征融合与重新校准,而MS-FANet[12]则利用多尺度特征提取和注意力机制优化局部表示。另一类方法强调架构创新,如DSA-Former[13]引入了可变形的大核注意力机制,以自适应地捕捉三维上下文信息。LM-Net[14]集成了多个Transformer金字塔分支,以高效地进行多尺度特征提取。ELANRes-MSCA-UNet[15]结合了重参数化残差模块和多尺度卷积注意力,以捕捉全局上下文。然而,基于CNN的方法在全局上下文建模方面仍存在固有局限。
基于Transformer的架构作为一种强大的替代方案,利用全局自注意力机制更有效地建模长距离依赖关系。这推动了大量混合CNN-Transformer模型的发展。Di等人[16]引入了方向感知模块和自注意力机制,以促进CT图像中的自动化肝肿瘤分割。DHT-Net[17]结合了动态卷积和Transformer组件,以增强三维分割能力。多分支残差Transformer网络[19]和CAFCT-Net[20]融合了卷积和Transformer模块,以联合捕捉局部和全局特征。一些模型进一步结合了注意力机制、多尺度融合或对抗学习,以增强肿瘤边界表示。例如,MAPFUNET[21]和Lgma-Net[22]利用注意力和多尺度融合技术,提高了对异质性和形态各异肿瘤的分割能力。HyborNet[23]采用了Gabor注意力卷积与Transformer模块,但需要高质量的CT图像,并可能在噪声或低对比度场景中表现不佳。MAEG-Net[24]集成了边缘感知模块和自适应融合策略,但严重依赖于Canny边缘检测器生成的边缘标签,这在边界较弱的情况下可能不可靠。同样,EG-UNETR[25]通过跨层级Transformer交互增强了边界细化,但面临类似的局限性。MA-cGAN[26]结合了注意力机制和对抗学习,提高了分割的准确性,但代价是较长的收敛时间和增加的训练复杂度。然而,对现有方法的深入分析表明,许多混合模型仍然存在三个根本性局限。首先,编码器和解码器之间的整合仍然不足。虽然这些模型具有复杂的编码器(结合CNN和Transformer特征),但这些多级编码器特征与解码器的融合通常依赖于简单的跳接连接[18]。这未能弥合深层抽象特征与浅层空间细节之间的语义差距,限制了解码器对全面语义层次的访问。其次,尽管空间域中的自注意力机制在全局上下文建模方面表现出色,但往往忽略了频率域中嵌入的丰富信息,而频率域对于描述纹理和锐利边界至关重要。第三,边界细化通常依赖于外部、手工设计的边缘检测器,这些检测器对噪声和对比度变化敏感,而不是通过内部可学习机制自适应地突出边界关键特征。
最近的研究探索了多种替代方法,包括多阶段网络、Mamba架构、多模态融合和动态建模,以提高长距离依赖关系的建模能力。例如,Yashaswini[27]和G-UNet[28]提出了两阶段分割设计,虽然在性能上有所提升,但也引入了显著的模型复杂性和计算负担。MMEFU-Net[29]采用了状态空间模型,以高效地建模长序列,解决了Transformer计算效率低下的问题。TexLiverNet[30]通过跨模态(文本-图像)注意力提高了小病灶的检测能力,但受限于高质量文本注释的可得性。TDFormer[31]动态调整了token的分辨率,以优先关注关键区域,平衡了精度和计算成本。RWKV-UNet[32]将轻量级的RWKV模块嵌入到U-Net主干中,以支持长距离建模并减少计算开销。
大多数现有方法专注于解决单一挑战,如改进长距离依赖关系、多尺度融合或边界细化,缺乏一个统一的策略来同时建模长距离依赖关系、细化边缘特征并适应多尺度肿瘤变化。为了解决这些问题,本文提出了FAFilTransNet,这是一种新颖的分割网络。与早期的混合方法不同,这些方法单独处理每个挑战,而FAFilTransNet通过三个专门设计的组件提供了一个统一的解决方案:一个在频率域中运行的全局滤波器Transformer编码器(GFTE),以克服仅基于空间处理的局限性;一个特征自适应残差模块(FARM),通过实现深层自适应多尺度特征融合来弥合编码器-解码器之间的语义差距;以及一个滤波激发模块(FEM),它提供了一个内部可学习的机制,用于边界细化,无需依赖外部边缘检测器,同时通过数据驱动的注意力机制提高了边界检测的准确性。这种协同设计使FAFilTransNet区别于以往的方法,并为肝病灶分割提供了一个更全面的解决方案。本文的主要贡献包括:
1. GFTE模块能够通过显式建模频率域表示,有效捕捉全局上下文信息,从而区分低对比度且边界模糊的病灶。从频率域的角度分析图像可以增强局部特征并建立长距离依赖关系。
2. FARM模块能够有效地保留关键信息,同时融合不同层级的特征,确保保留诊断相关的细节,同时增强对异质性肿瘤大小的多尺度表示。
3. FEM模块提供了一个内部可学习的机制,用于边界细化,该机制直接作用于频率增强的特征,无需依赖外部边缘检测器,同时通过数据驱动的注意力机制提高了边界检测的准确性。
在多个数据集上的广泛实验表明,FAFilTransNet在肝病灶分割任务中优于现有的最先进方法。消融实验确认了每个提出的组件对整体性能的显著贡献。这些结果表明,FAFilTransNet能够有效解决现有模型的局限性,通过捕捉全局上下文信息并保留局部细节,为医学影像中的准确肝病灶分割提供了一种有前景的解决方案。
本文其余部分的结构如下。第二部分将回顾相关工作。第三部分将介绍我们提出的方法。第四部分将讨论数据集和实验结果。第五部分将进一步探讨相关问题。最后,第六部分将总结本文并提出未来的研究方向。
在肝病灶分割领域,卷积神经网络(CNNs)一直是重要的研究方向。准确且自动化的肝肿瘤分割对于诊断、治疗规划和预后监测至关重要。尽管取得了显著进展,现有方法通常单独应对特定挑战,未能在整体和统一的解决方案上取得突破。早期的肝肿瘤分割方法依赖于传统的图像处理技术,如区域生长[33,34]、水平集[35]、分水岭和模糊分割等。然而,这些方法在处理复杂病灶形态和模糊边界时存在局限性。随着深度学习技术的发展,CNNs被广泛应用于医学图像分割任务。例如,全卷积网络(FCNs)[4]和U-Net[5]成为分割模型的基础架构。U-Net通过编码器-解码器结构实现了高效的特征提取和重建,但其局部感受野的限制导致难以建模长距离依赖关系。此外,编码器-解码器架构在多次下采样过程中容易丢失空间细节,而上采样路径往往忽略低级的细粒度特征,从而影响分割的精度。为克服这些局限,一些改进的CNN模型被提出,如SegNet[6]、Attention U-Net[7]、CE-Net[8]和Y-Net[9],它们通过跳接连接和注意力机制增强了局部特征提取能力。Shui等人[10]通过多尺度选择性特征融合和边缘引导注意力机制解决了肿瘤形状变化和边界模糊的问题。此外,一些方法专注于特征增强策略,如MS-UNet[11]采用了高级特征融合与重新校准技术,而MS-FANet[12]则通过多尺度特征提取和注意力机制优化了局部表示。另一类方法强调架构创新,如DSA-Former[13]引入了可变形的大核注意力机制,以自适应地捕捉三维上下文信息。LM-Net[14]集成了多个Transformer金字塔分支,以高效地进行多尺度特征提取。ELANRes-MSCA-UNet[15]结合了重参数化残差模块和多尺度卷积注意力,以捕捉全局上下文。然而,这些基于CNN的方法在全局上下文建模方面仍然存在固有局限。
近年来,Transformer架构因其全局自注意力机制而成为医学图像分割的新趋势。Transformer能够更有效地建模长距离依赖关系,从而提高了分割的准确性。这促使了大量混合CNN-Transformer模型的发展。例如,Di等人[16]引入了方向感知模块和自注意力机制,以促进CT图像中的自动化肝肿瘤分割。DHT-Net[17]结合了动态卷积和Transformer组件,以增强三维分割能力。多分支残差Transformer网络[19]和CAFCT-Net[20]融合了卷积和Transformer模块,以联合捕捉局部和全局特征。一些模型进一步结合了注意力机制、多尺度融合或对抗学习,以增强肿瘤边界表示。例如,MAPFUNET[21]和Lgma-Net[22]利用注意力和多尺度融合技术,提高了对异质性和形态各异肿瘤的分割能力。HyborNet[23]采用了Gabor注意力卷积与Transformer模块,但需要高质量的CT图像,并可能在噪声或低对比度场景中表现不佳。MAEG-Net[24]集成了边缘感知模块和自适应融合策略,但严重依赖于Canny边缘检测器生成的边缘标签,这在边界较弱的情况下可能不可靠。同样,EG-UNETR[25]通过跨层级Transformer交互增强了边界细化,但面临类似的局限性。MA-cGAN[26]结合了注意力机制和对抗学习,提高了分割的准确性,但代价是较长的收敛时间和增加的训练复杂度。然而,对现有方法的深入分析表明,许多混合模型仍然存在三个根本性局限。首先,编码器和解码器之间的整合仍然不足。虽然这些模型具有复杂的编码器(结合CNN和Transformer特征),但这些多级编码器特征与解码器的融合通常依赖于简单的跳接连接[18]。这未能弥合深层抽象特征与浅层空间细节之间的语义差距,限制了解码器对全面语义层次的访问。其次,尽管空间域中的自注意力机制在全局上下文建模方面表现出色,但往往忽略了频率域中嵌入的丰富信息,而频率域对于描述纹理和锐利边界至关重要。第三,边界细化通常依赖于外部、手工设计的边缘检测器,这些检测器对噪声和对比度变化敏感,而不是通过内部可学习机制自适应地突出边界关键特征。
为了克服这些挑战,近年来的研究探索了多种方法,包括多阶段网络、Mamba架构、多模态融合和动态建模。例如,Yashaswini[27]和G-UNet[28]提出了两阶段分割设计,这在性能上有所提升,但也引入了显著的模型复杂性和计算负担。MMEFU-Net[29]采用了状态空间模型,以高效地建模长序列,解决了Transformer计算效率低下的问题。TexLiverNet[30]通过跨模态(文本-图像)注意力提高了小病灶的检测能力,但受限于高质量文本注释的可得性。TDFormer[31]动态调整了token的分辨率,以优先关注关键区域,平衡了精度和计算成本。RWKV-UNet[32]将轻量级的RWKV模块嵌入到U-Net主干中,以支持长距离建模并减少计算开销。然而,这些方法仍然存在一定的局限性,尤其是在处理低对比度、模糊边界以及多尺度肿瘤变化方面。
基于上述分析,本文提出的FAFilTransNet旨在提供一个全面的解决方案,以应对这些挑战。FAFilTransNet的核心思想是通过频率域建模、自适应空间-语义融合和通道感知特征增强,实现对肝病灶的高效分割。具体而言,FAFilTransNet的编码器部分采用了双分支结构,其中CNN分支负责提取局部空间特征,而GFTE分支则在频率域中捕捉全局上下文信息。这种双分支结构能够有效整合局部和全局特征,提高模型对复杂病灶形态的适应能力。此外,FARM模块通过自适应多尺度特征融合,解决了编码器-解码器之间的语义差距问题,使得解码器能够充分利用高层抽象特征和低层空间细节。FEM模块则专注于频率域中的边界敏感特征增强,通过数据驱动的注意力机制,提高了模型对模糊边界和低对比度病灶的识别能力。
为了验证FAFilTransNet的有效性,我们在LiTS17和3Dircadb等三个公开数据集上进行了广泛的实验。LiTS17数据集包含131个病例,而3Dircadb数据集包含20个病例。所有CT图像及其对应的真值掩膜均具有512×512像素的分辨率,其中80%的数据被选为训练集。在数据预处理过程中,我们对Hounsfield Unit(HU)范围进行了裁剪,以提高分割的稳定性。实验结果表明,FAFilTransNet在多个指标(如Dice系数、VOE、RVD、ASD和模型复杂度)上均优于现有的最先进方法。消融实验进一步验证了每个模块对整体性能的贡献,证明了FAFilTransNet在处理低对比度、模糊边界和肿瘤形态变化方面的有效性。
在讨论部分,我们深入分析了FAFilTransNet在肝病灶分割任务中的优势。首先,通过频率域建模,GFTE模块能够捕捉更丰富的全局上下文信息,从而提高了模型对低对比度和模糊边界的鲁棒性。其次,FARM模块通过自适应多尺度特征融合,有效保留了诊断相关的细节信息,增强了模型对不同肿瘤大小和形态的适应能力。第三,FEM模块通过内部可学习的机制,实现了对边界敏感特征的增强,无需依赖外部边缘检测器,从而提高了边界检测的准确性。此外,FAFilTransNet在处理多尺度信息方面表现出色,能够在不同分辨率下保持较高的分割精度。这些优势使得FAFilTransNet在实际应用中具有较大的潜力,特别是在医学影像分析领域。
本文的研究结果表明,FAFilTransNet在肝病灶分割任务中具有显著的优越性。在LiTS17和3Dircadb数据集上的实验结果显示,该模型在多个指标上均优于现有方法,特别是在处理模糊边界和低对比度病灶方面表现突出。消融实验进一步验证了每个模块对整体性能的贡献,证明了FAFilTransNet在捕捉全局上下文信息和保留局部细节方面的有效性。此外,该模型在处理多尺度肿瘤变化时表现出良好的适应性,能够在不同肿瘤大小和形态下保持较高的分割精度。这些结果不仅展示了FAFilTransNet在肝病灶分割任务中的潜力,也为未来的研究提供了新的思路和方向。
在结论部分,我们总结了FAFilTransNet的主要贡献和优势。该模型通过频率域建模、自适应空间-语义融合和通道感知特征增强,为肝病灶分割提供了一个全面且高效的解决方案。GFTE模块在频率域中捕捉全局上下文信息,提高了模型对模糊边界和低对比度病灶的识别能力。FARM模块通过自适应多尺度特征融合,有效解决了编码器-解码器之间的语义差距问题,使得解码器能够充分利用高层抽象特征和低层空间细节。FEM模块则通过内部可学习的机制,实现了对边界敏感特征的增强,无需依赖外部边缘检测器,从而提高了边界检测的准确性。这些创新使得FAFilTransNet在处理复杂的肝病灶分割任务时表现出色,具有广泛的应用前景。
此外,本文的研究还揭示了当前肝病灶分割方法在处理低对比度、模糊边界和多尺度肿瘤变化方面的不足。现有的方法往往专注于解决单一问题,而缺乏统一的框架来同时建模长距离依赖关系、细化边缘特征并适应多尺度肿瘤变化。FAFilTransNet的提出填补了这一空白,为肝病灶分割提供了一个更加全面和高效的解决方案。通过频率域建模和多尺度特征融合,该模型能够更好地处理复杂的医学影像数据,提高分割的准确性和鲁棒性。这些改进不仅提升了分割效果,也为未来的研究提供了新的思路和方向。
在作者贡献声明中,我们明确了每位作者在本研究中的具体贡献。Hui Wang负责原始稿件的撰写、可视化、验证、软件开发、方法设计、调查、形式分析、数据管理和概念设计。Desheng Liu负责稿件的评审与编辑、可视化、验证、资金获取和数据管理。Sos S.Agaian负责稿件的评审与编辑、资源管理、项目管理、调查、形式分析和数据管理。Zhilei Zhao负责验证、方法设计、调查和形式分析。Yating Zhang负责其他相关工作。所有作者均对本研究的完成做出了重要贡献。
在竞争利益声明中,我们声明作者们没有已知的财务利益或个人关系可能影响本文所报告的研究工作。因此,本文的研究结果是客观和可信的。
最后,在致谢部分,我们感谢了对本研究提供支持的机构和项目。本文的研究得到了教育部“春晖计划”合作研究项目(资助编号HZKY20220302)和黑龙江省优秀青年教师基础研究项目(资助编号YQJH2023219)的支持。这些资助为本研究的顺利进行提供了重要保障,使得我们能够进行广泛的实验和深入的分析,从而验证FAFilTransNet的有效性和优越性。
综上所述,本文提出的FAFilTransNet为肝病灶分割提供了一个全新的解决方案。通过频率域建模、自适应空间-语义融合和通道感知特征增强,该模型能够有效应对低对比度、模糊边界和肿瘤形态变化等挑战,从而提高分割的准确性和鲁棒性。实验结果表明,FAFilTransNet在多个数据集上均优于现有方法,具有广泛的应用前景。未来的研究将进一步优化该模型的性能,探索其在其他医学影像任务中的应用潜力,并推动其在临床实践中的落地。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号