注意力增强涂鸦监督的医学图像分割:基于空间自注意力与相似性学习的创新框架

【字体: 时间:2025年06月13日 来源:Journal of Visual Communication and Image Representation 2.6

编辑推荐:

  针对医学图像分割中密集标注耗时的问题,研究人员提出AttenScribble框架,通过空间自注意力模块(SSA)和注意力相似性损失(ASL)增强涂鸦监督学习。该研究创新性地将Transformer的全局交互能力融入全卷积网络,结合掩码条件随机场(MCRF)构建三目标优化体系,在ACDC和CHAOS数据集上DSC达0.88/0.88,HD95显著降低至6.38/11.18mm,性能接近全监督基准,为弱监督医学图像分析提供了新范式。

  

在医学影像分析领域,精确的器官和组织分割对疾病诊断和治疗规划至关重要。然而,获取像素级标注数据需要专业医师投入大量时间,这成为制约深度学习技术应用的瓶颈。以涂鸦(scribble)为代表的弱监督标注方式虽能大幅降低标注成本,但稀疏的监督信号导致模型难以准确预测未标注区域的边界信息。现有方法如伪标签生成或条件随机场(CRF)后处理,往往存在误差累积或计算效率低的问题,特别是在处理心脏MRI和腹部CT等复杂解剖结构时表现受限。

针对这些挑战,研究人员开发了AttenScribble框架,创新性地将Transformer的全局建模能力与传统卷积网络结合。该研究通过三个关键技术突破:1)可插拔的空间自注意力模块(SSA)增强特征交互;2)基于归一化对称注意力的相似性度量构建ASL损失;3)定制化掩码条件随机场(MCRF)实现端到端优化。在ACDC心脏和CHAOS腹部数据集上的实验表明,该方法在保持计算效率的同时,边界定位精度显著优于现有技术。

研究方法上,团队采用2D U-Net为主干网络,在第三层编码器嵌入SSA模块。通过多头注意力机制计算Q/K/V特征,构建全局相似性矩阵S。结合空间距离掩码M,设计ASL损失函数:latn
= Σp,q∈ΩU

M[p,q]S[p,q]Σi≠j∈C
P?p
i
P?q
j
。最终联合优化目标包含三部分:部分分割损失lseg
、MCRF损失lmcrf
和ASL损失latn
,权重λ均设为0.1。实验采用20例ACDC和7例CHAOS作为测试集,评估指标包含Dice系数(DSC)和95%豪斯多夫距离(HD95)。

研究结果部分显示:

  1. 性能对比:在ACDC数据集上平均DSC达0.88,优于DMPLS(0.87)和GCRF(0.88);HD95仅6.38mm,显著低于ScribFormer的12.23mm。CHAOS数据集表现更突出,平均DSC 0.88与全监督相当,HD95 11.18mm优于所有对比方法。

  2. 模块消融:移除ASL导致HD95上升10.5%(ACDC)和20%(CHAOS),验证其对边界优化的关键作用。SSA置于第二编码层时性能最优,DSC比置于第四层高0.01。

  3. 可视化分析:如图2-3所示,该方法能有效抑制其他方法常见的假阳性(如心脏MRI中右心室误检),同时保持器官边界的平滑连续。特别是在肝脏分割中,准确捕捉了传统方法易遗漏的尖端结构。

结论部分指出,AttenScribble的创新性体现在三个方面:首先,SSA模块首次针对涂鸦监督任务定制,通过注意力机制实现全局特征交互;其次,ASL损失开创性地利用注意力矩阵驱动特征对齐;最后,MCRF与注意力学习的协同优化策略为单阶段弱监督训练提供了新思路。该研究不仅性能超越现有技术,更重要的是证明了不依赖伪标签的端到端弱监督学习可行性,这对降低医学AI应用门槛具有重要价值。未来工作将扩展至3D架构和更多模态,并探索注意力机制在其它弱监督场景中的应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号