
-
生物通官微
陪你抓住生命科技
跳动的脉搏
融合混合注意力与多尺度特征的甲状腺结节超声图像分割新方法HFA-UNet
【字体: 大 中 小 】 时间:2025年08月17日 来源:Knowledge-Based Systems 7.6
编辑推荐:
甲状腺结节超声图像分割面临形状多变、边界模糊等挑战,研究团队提出HFA-UNet模型,集成自注意力、空间与通道注意力机制,创新设计多尺度融合模块和动态跳连结构。实验表明,该模型在DDTI和TN3K数据集上Dice分数分别提升2.36%和1.66%,显著优于现有方法,为临床诊断提供更精准的AI辅助工具。
甲状腺结节的早期筛查对预防恶性病变至关重要,但传统超声诊断受限于图像分辨率低、结节形态多样等挑战。现有深度学习方法在跨设备、跨分辨率数据上的泛化能力不足,且固定尺寸输入导致特征丢失。针对这一临床痛点,宁波诺丁汉大学计算机科学学院的研究团队在《Knowledge-Based Systems》发表研究,提出混合全注意力U-Net模型HFA-UNet。
研究采用三大关键技术:1)融合ViT(Vision Transformer)与CBAM(Convolutional Block Attention Module)的混合注意力机制;2)基于空洞卷积的多尺度特征融合模块(FA-MSF);3)动态调整跳连数量(3-4层)的适应性架构。实验数据来自公开数据集DDTI(637张)、TN3K(3,493张)和Stanford Cine-Clip(1,742帧)。
1. 网络架构设计
模型通过FA-Downsampling阶段提取分层特征,ViT模块捕获全局依赖,FA-MSF模块采用1/6/12/18四种空洞率卷积聚合多尺度信息。创新性动态跳连机制根据输入分辨率(256×256或512×512)自动选择连接路径,减少信息冗余。
2. 性能验证
在DDTI数据集上,HFA-UNet-3版本Dice达85.20%(较MLMSeg提升2.36%),HD95边界误差仅23.90。跨数据集测试中,DDTI→TN3K迁移实验Dice保持70.18%,显著优于SwinUnet(63.40%),证明其强泛化能力。
3. 机制解析
消融实验显示,同时使用CBAM与ViT使Dice提升11.71%,而自适应跳连使低分辨率图像分割性能提升7.44%。多尺度融合模块对微小结节检出贡献显著,mIoU提高4.24%。
该研究突破性地解决了医学影像分析中的分辨率敏感性问题,其动态架构设计为多中心临床数据整合提供新思路。模型已开源,未来可扩展至乳腺肿瘤、肺结节等病灶分割领域,推动AI辅助诊断标准化进程。
生物通微信公众号
知名企业招聘