CE-UNet:一种具有滑动窗口交互功能的对比度敏感通道注意力网络,用于甲状腺结节分割
《Biomedical Signal Processing and Control》:CE-UNet: A contrast-sensitive channel attention network with sliding-window interaction for thyroid nodule segmentation
【字体:
大
中
小
】
时间:2026年02月19日
来源:Biomedical Signal Processing and Control 4.9
编辑推荐:
针对甲状腺超声图像低对比度、高噪声及形态变异等问题,提出CE-UNet模型。该模型通过通道增强注意力模块(CEAM)融合通道对比敏感特征与多尺度滑动窗口交互,在提升边界定位精度的同时保持轻量化。实验表明,在私有数据集和公共数据集(DDTI、TN3K)上,CE-UNet的Dice系数达0.8101,IoU为0.6964,显著优于CNN和Transformer基线模型,且在跨器官(BUSI)和跨数据集验证中均表现出优异泛化能力。
张梅如|马明伟|赵波|陈鸿宇|魏庆阳
北京科技大学自动化与电气工程学院工业光谱成像工程研究中心,中国北京
摘要
在超声图像中对甲状腺结节进行准确的分割在疾病筛查、风险评估和治疗计划中起着关键作用,但由于对比度低、斑点噪声和形态变化大,这一任务仍然具有挑战性。为了解决这些问题,本研究提出了
CE-UNet ,这是一种对比度敏感的通道注意力网络,它采用
通道增强注意力模块 (CEAM)进行细粒度特征建模和自适应的通道间依赖性学习。CEAM引入了一种结合均值和标准差统计信息的对比度敏感描述符,并结合多分支滑动窗口卷积来捕捉全局激活和多尺度通道关系。通过将CEAM嵌入U-Net的每个卷积块中,该模型能够在多个语义层次上自适应地强调具有区分性的通道,从而有效改善低对比度超声场景下的边界定位。在私有甲状腺超声数据集上的实验表明,CE-UNet取得了优异的性能(Dice =
0.8101 ,IoU =
0.6964 ,Precision =
0.8433 ,Recall =
0.8272 ),优于基于CNN和Transformer的基线模型。在DDTI和TN3K上的跨数据集评估以及在BUSI上的跨器官实验进一步证实了CE-UNet的鲁棒性和泛化能力。配对
t 测试显示,与大多数基线模型相比,CE-UNet具有统计学上的显著改进(
p < 0 . 05 ),与MiniSeg、U-Net++和Swin-UNETR相比,其显著性也较为明显(p ≈ 0 . 05 )。总体而言,CE-UNet在准确性、效率和紧凑性之间取得了有效的平衡,显示出在实际临床应用中的巨大潜力。代码: https://github.com/meiruzhang2022/CE-UNet 。
引言
近年来,甲状腺癌的全球发病率持续上升[1],使其成为全球第七大常见恶性肿瘤[2]。根据2024年世界癌症报告,2020年全球报告的新发甲状腺癌病例超过58万例,且发病人群趋于年轻化[3]。由于超声成像具有无创、实时、成本效益高和便捷的特点[4],它已成为甲状腺结节筛查的主要手段[5]、[6]、[7]。然而,超声图像通常存在对比度低、噪声高和边界不明确的问题[8],这使得手动标注既耗时又高度依赖于操作者的经验[9],从而限制了诊断效率和一致性。因此,开发高效且鲁棒的自动分割算法对于提高诊断准确性和减轻临床医生的工作负担至关重要[10]。然而,现有方法往往难以在分割准确性和模型复杂性之间取得平衡,尤其是在对比度低和边界不明显的挑战性区域。迫切需要一种能够有效建模通道特征并增强关键病变区域识别的分割策略。
大多数现有方法侧重于网络架构设计[11]、[12]、[13]、[14]、空间注意力机制[15]、[16]、[17]或多尺度特征提取[18]、[19]、[20]、[21],但很少同时考虑单个通道内的结构异质性和相邻通道之间的局部依赖性[22]。以经典的U-Net[23]为例,其编码器-解码器结构和跳跃连接可以在一定程度上恢复空间细节。然而,在对比度低且病变边界不明显的超声图像中,它仍然容易漏检和不连续的轮廓。UNet++[24]通过引入嵌套子网络来改进多尺度特征融合,但这种密集的架构显著增加了参数数量和计算成本,使得训练和推理更加耗时。Attention U-Net[15]将空间注意力融入跳跃连接中,使模型能够抑制背景噪声并减少一些伪影。尽管如此,它在通道维度上缺乏细粒度的特征选择,并且在处理通道间的细微对比度变化时效果不佳。类似的多通道卷积策略也在其他生物医学领域得到了探索,例如,多通道深度卷积网络被应用于可药物化蛋白质预测[25],证明了多通道特征建模在不同模态下的通用性。
在通道注意力方面,Squeeze-and-Excitation(SE)模块[26]使用全局平均池化(GAP)对每个通道进行全局重加权,显著增强了模型对信息丰富通道的响应。然而,GAP仅捕获每个通道的平均激活值,忽略了通道内的纹理变化和局部对比度波动。Efficient Channel Attention(ECA)模块[27]用一维卷积替换了全连接层,以捕获局部通道间依赖性,从而避免了参数开销。然而,其固定的核大小限制了通道交互的范围和灵活性。空间多尺度方法,如孔洞(膨胀)卷积[28]和金字塔池化[19]、[29],在捕捉不同尺度的上下文方面有效,但通常涉及多个并行分支和大量的超参数调整工作。此外,它们并没有明确增强通道维度的特征选择。最近,基于Transformer的U-Net变体[30]、[31]、[32]、[33]、[34]、[35]、[36]、[37]通过全局自注意力在建模长距离依赖性方面取得了有希望的结果,但在检测小目标和细边界方面仍不尽如人意。此外,它们过大的内存占用和计算成本对临床应用构成了重大挑战[38]。
显然,无论是空间多尺度设计还是全局/局部通道注意力机制,都没有同时解决两个关键问题:量化通道内的对比度和自适应捕获多个感受范围上的通道交互。基于此,我们提出了通道增强注意力模块(CEAM),它利用由均值和标准差构建的对比度敏感描述符来表征通道激活强度和空间异质性。此外,CEAM采用多分支滑动窗口策略来自适应地捕获不同交互范围内的通道间语义依赖性。这种设计在保持轻量级架构的同时,提高了低对比度和边界不明显的病变的区分能力,适用于临床应用。
本文的其余部分安排如下:第2节介绍CE-UNet的总体架构;第3节描述数据集和实验设置;第4节报告实验结果;第5节提供进一步分析和讨论;第6节总结本文并展望未来方向。
部分代码片段
整体网络架构
所提出的CE-UNet的总体架构如图1所示。它遵循U-Net的经典编码器-解码器范式。编码器由四个卷积块组成,这些卷积块的分辨率逐渐降低,旨在提取和压缩图像特征,以实现更丰富的语义表示和更大的感受场。解码器使用转置卷积逐步上采样高级语义特征,并将其与相应的空间细节融合
数据集
本研究使用了来自甲状腺和乳腺领域的四个超声数据集(见表2),以全面评估所提出的CE-UNet的分割性能、鲁棒性和跨领域适应性。私有甲状腺超声数据集作为模型训练和消融分析的主要来源。训练后的模型随后在两个公开可用的甲状腺数据集DDTI[40]和TN3K[41]上进行了验证,以评估跨数据集的泛化能力
实验结果
本节介绍了针对所提出的CE-UNet在分割准确性、泛化能力、消融能力和效率方面进行的全面实验。所有实验都在相同的预处理、训练和评估协议下进行。
讨论
所提出的CE-UNet专注于增强超声分割中的通道间表示,而传统方法通常强调空间注意力,但忽略了通道间的语义信息。通过结合对比度敏感描述符和滑动窗口多分支设计,CEAM有效捕获了通道间的强度变化和上下文相关性。这种机制使模型即使在对比度弱或异质性强的情况下也能更好地划分结节边界
结论
本研究提出了CE-UNet,这是一个轻量级但有效的甲状腺超声结节分割框架。通过引入具有对比度感知统计描述符和多尺度通道交互建模的通道增强注意力机制,CE-UNet增强了通道间表示,并在具有挑战性的低对比度和异质性成像条件下改善了边界划分。在私有和公共数据集上的全面实验表明,CE-UNet
CRediT作者贡献声明
张梅如: 撰写——原始草稿、可视化、验证、方法论、概念化。马明伟: 监督、资源提供、项目管理、资金获取、数据管理。赵波: 监督、资源提供、调查、概念化。陈鸿宇: 撰写——审稿与编辑、监督、数据管理。魏庆阳: 撰写——审稿与编辑、项目管理。
利益冲突声明
我们声明与任何可能不恰当地影响我们工作的个人或组织没有财务和个人关系,也没有任何形式的专业或其他个人利益涉及任何产品、服务和/或公司,这些可能会影响本文的观点或对题为“CE-UNet:一种用于甲状腺结节分割的对比度敏感通道注意力网络”的手稿的评审。
致谢
本工作部分得到了北京自然科学基金联合基金 (授权号:L232126)和国家自然科学基金 (授权号:12375337)的支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号