MSFFE-Net:多尺度空间-频率特征增强算法,用于精确的肝脏肿瘤分割
《Biomedical Signal Processing and Control》:MSFFE-Net: Multi-scale Spatial-Frequency Feature Enhancement for accurate liver tumor segmentation
【字体:
大
中
小
】
时间:2025年10月17日
来源:Biomedical Signal Processing and Control 4.9
编辑推荐:
精准肝脏肿瘤分割面临异质性高、边界模糊和小病灶检测难的问题。本文提出MSFFE-Net,创新性地融合空间-频率域多尺度特征增强机制,通过SFDF模块将CT图像与傅里叶频域特征结合为四通道输入,双分支编码器协同标准卷积和残差膨胀卷积捕获多尺度信息,MSE模块实现瓶颈层多尺度语义增强,并利用CBAM注意力优化跳转连接。实验表明,在LiTS_2017和3Dircadb数据集上,肝脏分割Dice达98.12%和97.24%,肿瘤分割达89.61%和92.87%,优于nnU-Net和TransUNet等主流方法,参数量仅17.46MB,推理速度68.74FPS。消融实验验证各模块有效性,为智能肝癌诊断提供新范式。
在医学图像分析领域,肝脏肿瘤的精准分割对于早期诊断和手术规划具有至关重要的意义。然而,目前的分割方法在处理肿瘤异质性、边界模糊以及小病灶识别等方面仍存在诸多挑战。这些问题的主要根源在于现有模型在多尺度特征融合和空间感知能力方面的不足。为了克服这些局限,研究人员提出了一种名为MSFFE-Net的新分割网络,该网络通过引入多尺度空间-频率特征增强机制,旨在统一空间与频率域,从而提升特征的表达能力。此外,该模型还融合了空间-频率域模块(SFDF),结合双通道编码器,使用标准卷积和残差扩张卷积(RDC)联合进行多尺度特征提取,以增强边缘感知能力。在瓶颈层引入多尺度语义增强(MSE)模块,用于建模全局上下文信息,同时在跳跃连接中嵌入CBAM注意力机制,进一步优化特征聚合过程。经过在LiTS_2017和3Dircadb等公开数据集上的大量实验验证,MSFFE-Net在肝脏分割任务中取得了98.12%和97.24%的Dice系数,在肿瘤分割任务中则达到了89.61%和92.87%。与主流方法如nnU-Net和TransUNet相比,MSFFE-Net在复杂肿瘤数据集上的Dice提升分别为0.07%和2.57%,以及1.00%和1.83%。该模型在准确性和效率之间取得了良好的平衡,仅需17.46 MB的参数量,推理速度达到68.74 FPS。消融实验进一步验证了该模型在复杂边界和小病灶分割中的有效性,推动了智能肝脏癌症诊断技术的发展,同时具备应用于其他器官肿瘤分割的潜力。
肝脏肿瘤的分割是一项极具挑战性的任务,其重要性不仅体现在对疾病诊断的准确性上,还影响着手术方案的制定和治疗效果的评估。在医学影像中,肝脏往往被复杂的组织结构包围,这使得肿瘤与周围正常组织的区分变得更加困难。此外,肝脏肿瘤本身具有高度的异质性,不同区域的组织密度、纹理特征以及形态结构可能存在显著差异。这种异质性不仅增加了分割的复杂度,也对模型的泛化能力提出了更高要求。同时,肿瘤边界可能不够清晰,尤其是在影像质量较低或病灶较小的情况下,分割模型难以准确识别边界,导致分割结果的不精确。因此,为了提高肝脏肿瘤分割的准确性,研究者们不断探索新的方法和技术。
传统的卷积神经网络(CNN)在处理医学图像分割任务时表现出一定的局限性。CNN通过局部感受野进行特征提取,虽然在提取细节信息方面具有优势,但在捕捉全局上下文和长距离依赖关系时能力较弱。这使得模型在处理具有复杂背景或边界模糊的医学图像时效果不佳。为了解决这一问题,近年来研究者们引入了多种注意力机制,如Squeeze-and-Excitation(SE)和Efficient Channel Attention(ECA),这些机制能够帮助模型更有效地关注关键的分割特征,同时抑制无关信息的干扰。此外,Transformer架构因其全局注意力机制,在处理长距离依赖关系方面表现出色,但其在捕捉局部细节和空间信息方面的能力相对有限。因此,研究者们尝试将Transformer与CNN相结合,开发出具有混合优势的模型结构,如CTBANet和Spider-Net。
在这一背景下,MSFFE-Net的提出具有重要的现实意义。该模型通过多尺度空间-频率特征增强机制,结合了空间域和频率域的信息,从而提升了特征的表达能力。同时,该模型还引入了双通道编码器,通过标准卷积和残差扩张卷积的联合使用,实现了多尺度特征提取和边缘感知的增强。在瓶颈层,MSFFE-Net引入了多尺度语义增强模块,用于建模全局上下文信息,并通过并行提取不同尺度的语义特征,提升了分割的准确性。此外,CBAM注意力机制被嵌入到跳跃连接中,以优化通道和空间特征,抑制背景干扰,并提高小病灶的定位精度。
为了验证MSFFE-Net的有效性,研究者们在LiTS_2017和3Dircadb两个公开数据集上进行了大量的实验。这两个数据集在医学图像分割领域具有广泛的应用,能够为评估分割算法的准确性和鲁棒性提供可靠的基准。实验结果显示,MSFFE-Net在肝脏分割任务中取得了较高的Dice系数,分别达到98.12%和97.24%,在肿瘤分割任务中则分别达到89.61%和92.87%。与主流方法如nnU-Net和TransUNet相比,MSFFE-Net在复杂肿瘤数据集上的表现更为出色,Dice系数的提升分别为0.07%和2.57%,以及1.00%和1.83%。这表明,MSFFE-Net在处理复杂边界和小病灶时具有更强的适应能力。
此外,MSFFE-Net在参数量和推理速度之间取得了良好的平衡。该模型仅需17.46 MB的参数量,推理速度达到68.74 FPS,这在实际应用中具有重要意义。医学图像分割通常需要处理大量的数据,模型的计算效率直接影响其在临床环境中的实用性。因此,MSFFE-Net的高效性使其在实际应用中更具优势。同时,该模型的结构设计也考虑到了特征的复用效率,通过引入CARAFE机制,提升了特征的利用效率,减少了信息损失。
在模型设计过程中,研究者们进行了详尽的消融实验,以验证各个模块对整体性能的贡献。这些实验结果表明,MSFFE-Net的各个模块在提升分割准确性方面起到了关键作用。例如,SFDF模块在融合空间域和频率域信息方面表现出色,有助于增强对复杂边界和低对比度区域的感知能力。双通道编码器通过标准卷积和RDC的联合使用,实现了多尺度特征提取和边缘感知的增强。MSE模块在瓶颈层引入,通过并行提取不同尺度的语义特征,提升了全局信息的融合能力。CBAM注意力机制在跳跃连接中的应用,进一步优化了特征聚合过程,提高了小病灶的定位精度。
综上所述,MSFFE-Net在肝脏肿瘤分割任务中表现出显著的优越性,不仅在分割准确性上取得了突破,还在计算效率和参数量方面实现了良好的平衡。该模型的成功得益于其多尺度空间-频率特征增强机制、双通道编码器、多尺度语义增强模块以及CBAM注意力机制的协同作用。这些创新使得MSFFE-Net能够更好地应对医学图像分割中的复杂挑战,如肿瘤异质性、边界模糊和小病灶识别。此外,MSFFE-Net在实际应用中的高效性,使其具备在临床环境中推广的潜力,同时也为其他器官的肿瘤分割提供了新的思路和方法。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号