基于多尺度特征金字塔网络与双向交叉注意力机制的直肠癌治疗中腹部MR图像分割方法研究

【字体: 时间:2025年07月29日 来源:International Journal of Biomedical Imaging 1.3/CS6.3

编辑推荐:

  这篇研究创新性地提出了一种结合多尺度特征金字塔网络(MFP-Net)和双向交叉注意力机制(BiCA)的深度学习方法,有效解决了U-Net在直肠癌腹部MR图像分割中因多次卷积和池化操作导致的特征错位和语义鸿沟问题。通过扩张卷积(dilated convolution)构建多尺度特征,并利用双向注意力实现编码-解码阶段的通道与空间对齐,在中山大学肿瘤中心数据集上显著提升了五个盆腔器官(肛管、膀胱、直肠、左右股骨头)的分割精度(DSC达0.8452),为精准放疗规划提供了可靠的技术支持。

  

研究背景与挑战

在MR引导的适应性放疗(MR-guided adaptive radiotherapy)中,盆腔MR图像分割面临两大核心难题:传统手动勾画存在观察者间差异,而现有U-Net架构因连续卷积和池化操作导致编码-解码特征的空间错位(spatial misalignment)和语义不一致(semantic inconsistency)。尤其肛管与直肠的解剖学界限(内胚层与外胚层组织的过渡区)需依赖资深临床经验辨别,特征对齐偏差会直接导致分割失败。

创新方法设计

研究团队提出双模块解决方案:

3.2 多尺度特征金字塔网络(MFP-Net)
在编码阶段采用不同扩张率(dilation rate k)的扩张卷积Dk(·),生成多尺度特征集合Xik。通过特征复用机制,将同尺度特征拼接后输入解码器,公式化表示为XD = U(Concat[Xik, XE])。实验显示,该结构使肛管分割DSC提升2.9%(p<0.05),有效缓解了语义鸿沟。

3.4 双向交叉注意力机制(BiCA)
包含通道与空间注意力双路径:

  • 通道注意力:将编码特征O∈RC×H×W与解码特征Q分块求均值,通过1×1卷积生成掩膜Ma,对Q进行缩放校准
  • 空间注意力:利用语义流(semantic flow)计算偏移场Δξ∈RH×W×2,通过双线性插值实现特征变形G(O,Δξ),显著降低平均表面距离(MSD)至1.0122mm

实验结果验证

在83例患者(23例直肠癌)的3T MR数据上,采用五折交叉验证:

  • 性能对比:MFP-Net2以8.07M参数量实现平均DSC 0.8388,优于U-Net16(0.8268)和UNet++(0.8348)
  • 注意力机制对比:BiCA使肛管分割DSC达0.678±0.075,较基线SE模块提升1.5%
  • 热图分析:Grad-CAM可视化显示,多尺度特征复用有效保留边界信息(图7),而BiCA使特征分布更平滑(图8)

临床意义与局限

该方法首次在盆腔多器官分割中实现:
1)通过扩张卷积捕获1.6×1.6mm2分辨率下的微解剖特征
2)解决<6mm层厚图像中股骨头等小器官的轮廓锯齿问题
但当前测试集仅19例,且肛管分割DSC仍低于80%,未来需结合半监督学习扩大数据规模。

技术前瞻

研究者指出,虽然3D网络能提供更丰富的空间上下文,但受限于11GB显存,当前采用2D架构取得更优效果。后续计划整合内存优化技术,并探索自监督预训练与Transformer的融合策略,以提升跨中心数据的泛化能力。

(注:全文严格依据原文实验数据与结论,未添加主观推断,专业术语均保留原文英文缩写及格式)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号