全局上下文交互Transformer(GCIFormer):面向三维医学图像分割的语义鸿沟破解新范式

【字体: 时间:2025年08月27日 来源:Biomedical Technology CS4.1

编辑推荐:

  本文提出GCIFormer模型,通过创新性全局上下文交互(GCI)模块解决U型网络中编码器-解码器特征融合时的语义鸿沟问题。该模型结合动态语义令牌精修(STRM)和局部特征增强(LFEM),在BraTS21等数据集上实现MRI/CT三维医学图像分割的SOTA性能,为肿瘤精准诊疗提供新工具。

  

Highlight亮点

• 提出全局上下文交互(GCI)模块,通过跨注意力机制将语义信息注入编码器特征,使局部特征能捕捉全局上下文关系

• 引入迭代更新的动态语义令牌,实现从深层到浅层的多尺度特征融合与通信

• 在解码器中设计基于跨注意力的特征融合模块,性能优于传统拼接或求和策略

• 在BraTS21、KiTS19和BTCV数据集上建立医学图像分割新基准

Methodology方法学

如图3所示,GCIFormer采用U型架构,核心创新在于跳过连接中的GCI模块。该模块包含:

1)局部特征增强模块(LFEM):通过3D卷积提取空间特征

2)语义令牌精修模块(STRM):通过跨注意力动态更新全局语义令牌,以自底向上方式增强多尺度特征交互

解码器采用改进的Swin Transformer块,先通过跨注意力融合精炼后的编码器特征与上采样解码器特征,再通过自注意力进一步优化。

Experiments实验验证

在BraTS21(脑肿瘤MRI)、KiTS19(肾脏CT)和BTCV(腹部CT)数据集上的实验表明:

• 平均Dice系数提升2.3%-4.7%

• 肿瘤边界分割精度显著提高

消融实验证实GCI模块使编码器特征在目标区域的响应强度提升38%

Conclusion结论

GCIFormer通过混合3D卷积与Transformer架构,结合创新的动态语义交互机制,为三维医学图像分割提供新范式。其模块化设计可灵活集成到现有U型网络中,在肿瘤定量分析和手术规划等领域具有临床应用价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号