基于CNN与Swin Transformer的双编码器U-Net模型(DCSwin-UNet)在脑肿瘤MRI分割中的应用研究

【字体: 时间:2025年07月05日 来源:Biomedical Signal Processing and Control 4.9

编辑推荐:

  针对脑MRI图像分割中解剖结构变异性和上下文信息捕获不足的难题,R. Rekha团队提出融合CNN局部特征提取与Transformer全局建模能力的DCSwin-UNet模型。通过可训练乘法层(TML)增强特征共现分析,结合CLAHE等数据增强技术,模型在Kaggle脑肿瘤数据集上实现IOU 86.3%和Dice系数89.7%的突破性性能,为CAD系统提供更精准的病灶定位方案。

  

在神经影像诊断领域,脑肿瘤的精准分割犹如在复杂地形中绘制等高线——既要捕捉细微的组织变异,又要把握整体解剖关联。当前临床面临双重困境:传统活检存在49.1%准确率瓶颈且伴随出血风险,而常规MRI分析高度依赖医师经验。更棘手的是,人脑解剖结构的个体差异使现有算法在IOU指标上难以突破80%门槛,这直接影响了计算机辅助诊断(CAD)系统对恶性胶质瘤等侵袭性病灶的识别精度。

针对这一挑战,研究人员创新性地构建了DCSwin-UNet架构。该模型巧妙融合卷积神经网络(CNN)的局部特征提取优势与Swin Transformer的全局建模能力,通过双编码器设计实现多尺度特征融合。特别引入的可训练乘法层(TML)能动态学习特征图间的非线性交互,其机制类似于生物视觉系统的侧抑制效应。研究采用Kaggle提供的3,929对MRI-掩模数据(源自TCIA的110例患者),通过弹性变形(ElasticTransform)等8种增强策略解决数据不平衡问题。

数据收集
基于TCIA的临床队列包含2,556例阳性样本(含肿瘤)和1,373例阴性样本,覆盖脑膜瘤、胶质瘤等主要亚型。预处理采用自适应直方图均衡化(CLAHE)提升对比度,为模型提供标准化的输入。

结果分析
实验显示,结合VGG16预训练权重的混合架构性能最优:在测试集上达到86.3% IOU和89.7% Dice系数,较传统U-Net提升12.8%。消融实验证实,Swin U-Net编码器的长程依赖建模使小肿瘤检出率提高23%,而GELU激活函数较ReLU带来1.4%的特异性提升。

结论
该研究突破性地实现了三大创新:1)首创CNN-Transformer双流特征融合框架;2)开发具有生物学启发性的TML层;3)建立涵盖光学畸变(OpticalDistortion)等复杂干扰的鲁棒训练体系。这些进展使得模型在保持94.2%高敏感度的同时,将假阳性率控制在5.8%,为临床决策提供可靠依据。

讨论
值得注意的是,该模型在垂体瘤等微小病灶(<5mm)分割中仍存在8.7%的漏检率,这可能与MRI的局部容积效应有关。未来研究可结合扩散张量成像(DTI)等多模态数据进一步提升性能。这项发表于《Biomedical Signal Processing and Control》的成果,标志着自适应脑肿瘤分割技术向临床实用化迈出关键一步。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号