
-
生物通官微
陪你抓住生命科技
跳动的脉搏
全局上下文交互Transformer(GCIFormer):面向三维医学图像分割的语义鸿沟破解新范式
【字体: 大 中 小 】 时间:2025年08月27日 来源:Biomedical Technology CS4.1
编辑推荐:
本文提出GCIFormer模型,通过创新性全局上下文交互(GCI)模块解决U型网络中编码器-解码器特征融合时的语义鸿沟问题。该模型结合动态语义令牌精修(STRM)和局部特征增强(LFEM),在BraTS21等数据集上实现MRI/CT三维医学图像分割的SOTA性能,为肿瘤精准诊疗提供新工具。
Highlight亮点
• 提出全局上下文交互(GCI)模块,通过跨注意力机制将语义信息注入编码器特征,使局部特征能捕捉全局上下文关系
• 引入迭代更新的动态语义令牌,实现从深层到浅层的多尺度特征融合与通信
• 在解码器中设计基于跨注意力的特征融合模块,性能优于传统拼接或求和策略
• 在BraTS21、KiTS19和BTCV数据集上建立医学图像分割新基准
Methodology方法学
如图3所示,GCIFormer采用U型架构,核心创新在于跳过连接中的GCI模块。该模块包含:
1)局部特征增强模块(LFEM):通过3D卷积提取空间特征
2)语义令牌精修模块(STRM):通过跨注意力动态更新全局语义令牌,以自底向上方式增强多尺度特征交互
解码器采用改进的Swin Transformer块,先通过跨注意力融合精炼后的编码器特征与上采样解码器特征,再通过自注意力进一步优化。
Experiments实验验证
在BraTS21(脑肿瘤MRI)、KiTS19(肾脏CT)和BTCV(腹部CT)数据集上的实验表明:
• 平均Dice系数提升2.3%-4.7%
• 肿瘤边界分割精度显著提高
消融实验证实GCI模块使编码器特征在目标区域的响应强度提升38%
Conclusion结论
GCIFormer通过混合3D卷积与Transformer架构,结合创新的动态语义交互机制,为三维医学图像分割提供新范式。其模块化设计可灵活集成到现有U型网络中,在肿瘤定量分析和手术规划等领域具有临床应用价值。
生物通微信公众号
知名企业招聘