
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多尺度交互与局部增强桥接网络在医学图像分割中的创新应用
【字体: 大 中 小 】 时间:2025年07月23日 来源:Computerized Medical Imaging and Graphics 5.4
编辑推荐:
针对医学图像分割中多尺度特征融合不足和局部细节丢失问题,研究人员提出MILENet网络,通过多尺度交互模块(MSI)和局部增强模块(LE)实现全局关联与局部细节优化,在CT/MRI和内镜图像数据集上达到SOTA性能,为精准医疗诊断提供新工具。
医学图像分割是辅助疾病诊断和治疗规划的关键技术,但传统方法面临多尺度特征错配和局部细节丢失的难题。现有基于CNN和Transformer的模型虽能分别捕捉局部特征和全局依赖,却难以平衡两者关系,导致小病灶或复杂解剖结构的分割精度不足。尤其当处理腹部CT中弥散性病变或内镜下息肉等跨尺度目标时,简单跳跃连接会引发特征对齐偏差,影响分割轮廓的连贯性。
针对这一挑战,重庆大学的研究团队在《Computerized Medical Imaging and Graphics》发表研究,提出MILENet——一种融合多尺度交互(Multi-scale Interaction, MSI)与局部增强(Local Enhancement, LE)模块的桥接网络。该网络通过PVT-v2编码器提取层级特征,创新性地设计上下文桥接结构:MSI模块采用跨尺度注意力重组特征,解决全局-局部特征错配;LE模块结合膨胀坐标注意力(Dilated Coordinate Attention)和级联卷积FFN(Feed-Forward Network),增强边缘敏感度;辅以源驱动连接(Source-Driven Connection, SDC)机制保留跨层细节。研究采用多模态验证策略,涵盖Synapse腹部CT、ACDC心脏MRI及5个结肠镜数据集(Kvasir、CVC系列等)。
关键技术包括:1)基于PVT-v2的多尺度特征金字塔构建;2)MSI模块的跨分辨率特征交互;3)LE模块的膨胀坐标注意力机制;4)SDC的残差-稠密混合连接。实验证明该方法在Dice系数和mIoU指标上显著超越TransUNet、SwinUNet等基线模型,尤其对胰腺(PC)等小器官分割提升达3.2%。
主要研究结果:
讨论指出,MILENet的创新性体现在三方面:首先,MSI-LE协同机制突破了传统编码器-解码器的单向信息流限制;其次,膨胀坐标注意力首次将空间-通道联合建模应用于医学图像桥接层;最后,多模态验证证实其泛化能力,从毫米级CT切片到亚毫米级内镜图像均适用。局限性在于对动态超声影像的时序特征捕捉尚未优化,未来拟引入3D卷积扩展。该研究为医学图像分析提供了可解释性强、跨模态通用的新框架,代码已开源(GitHub/syzhou1226/MILENET)。
生物通微信公众号
知名企业招聘