全局上下文交互Transformer（GCIFormer）：面向三维医学图像分割的语义鸿沟破解新范式

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年08月27日 来源：Biomedical Technology CS4.1

编辑推荐：

　　本文提出GCIFormer模型，通过创新性全局上下文交互（GCI）模块解决U型网络中编码器-解码器特征融合时的语义鸿沟问题。该模型结合动态语义令牌精修（STRM）和局部特征增强（LFEM），在BraTS21等数据集上实现MRI/CT三维医学图像分割的SOTA性能，为肿瘤精准诊疗提供新工具。

Highlight亮点

• 提出全局上下文交互（GCI）模块，通过跨注意力机制将语义信息注入编码器特征，使局部特征能捕捉全局上下文关系

• 引入迭代更新的动态语义令牌，实现从深层到浅层的多尺度特征融合与通信

• 在解码器中设计基于跨注意力的特征融合模块，性能优于传统拼接或求和策略

• 在BraTS21、KiTS19和BTCV数据集上建立医学图像分割新基准

Methodology方法学

如图3所示，GCIFormer采用U型架构，核心创新在于跳过连接中的GCI模块。该模块包含：

1）局部特征增强模块（LFEM）：通过3D卷积提取空间特征

2）语义令牌精修模块（STRM）：通过跨注意力动态更新全局语义令牌，以自底向上方式增强多尺度特征交互

解码器采用改进的Swin Transformer块，先通过跨注意力融合精炼后的编码器特征与上采样解码器特征，再通过自注意力进一步优化。

Experiments实验验证

在BraTS21（脑肿瘤MRI）、KiTS19（肾脏CT）和BTCV（腹部CT）数据集上的实验表明：

• 平均Dice系数提升2.3%-4.7%

• 肿瘤边界分割精度显著提高

消融实验证实GCI模块使编码器特征在目标区域的响应强度提升38%

Conclusion结论

GCIFormer通过混合3D卷积与Transformer架构，结合创新的动态语义交互机制，为三维医学图像分割提供新范式。其模块化设计可灵活集成到现有U型网络中，在肿瘤定量分析和手术规划等领域具有临床应用价值。

热点排行

联系信箱：

粤ICP备09063491号