E-SegNet:基于E型结构网络的精准2D与3D医学图像分割新范式

【字体: 时间:2025年09月05日 来源:Research 10.7

编辑推荐:

  研究人员针对U型结构医学图像分割模型参数量大、计算效率低的问题,创新性提出E型分割框架(E-SegNet),通过多尺度特征直接聚合和MLKConv模块,在Synapse等8个数据集上实现DSC提升5%、参数量减少73%,为轻量化精准分割提供新思路。

  

医学图像分割是辅助临床诊断的关键技术,但传统U型网络如U-Net存在明显瓶颈:对称编解码结构导致参数膨胀,逐步上采样过程造成细节丢失。当前最优模型在Synapse数据集参数量超1亿,但DSC仅比2020年模型提升5%——这种"参数爆炸,性能缓增"的现象严重制约临床部署。更棘手的是,复杂器官如胰腺(平均DSC仅65%)和微小结构如胆囊的边界模糊问题始终未解。

为突破这一困境,Zhaoqi等创新性提出E型结构网络(E-SegNet),其核心突破在于:① 摒弃传统逐级解码,直接聚合编码器多尺度特征;② 设计多尺度大核卷积(MLKConv)模块,通过3/5/7/11混合核与3/5/7/11膨胀率的深度可分离卷积,以4C2+70C的低参数量实现全局-局部特征融合。研究构建了2D和3D双版本,2D版采用MobileNet V4编码器,3D版选用Video Swin Transformer,通过跨阶段特征直接上采样至原分辨率后求和,再经MLKConv细化输出。

关键技术包括:① 采用Synapse、ACDC等8个公开数据集进行5折交叉验证;② 设计新型损失函数0.6Ldice+0.4Lce;③ 在RTX 3090 GPU上测试74.63 FPS的实时性能;④ 通过消融实验验证[2-5]阶段聚合最优。

模型性能

在Synapse数据集上,2D E-SegNet以86.15% DSC刷新纪录,胰腺分割提升2.64%;3D版更以87.76% DSC超越D-LKA Net,HD95降低3.25。特别在BUSI超声数据中,其81.91% DSC显著优于AgileFormer(78.63%),且标准差降低1.09%,展现强鲁棒性。

计算效率

2D模型仅30.88M参数,比SwinUNet提速418%;3D版31.74M参数下仍保持78.62 FPS,FLOPs较UNETR降低28.24%。MLKConv模块的消融实验显示,移除后DSC骤降15.8%,证实其关键作用。

结构拓展性

将U-Net等5种模型改为E型结构后,参数量平均降低20%,DSC反升0.7%。但视频Swin Transformer编码器的初始patch层特征会干扰聚合,需排除以获得最佳效果。

这项发表于《Research》的工作开创了医学图像分割新范式,其临床意义在于:① 为资源受限场景提供高精度轻量化方案,ACDC心脏分割达92.53% DSC;② 多尺度特征直接聚合策略保留更多微小结构信息,胰腺CT分割ASD降至1.10 mm;③ 通用架构设计支持2D/3D任务迁移,Kvasir-SEG息肉分割达94.83% DSC。未来可通过引入动态卷积核和混合精度训练进一步优化3D版的显存消耗,推动其在PET-CT等多模态影像中的应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号