LMM-UNet:一种轻量级的UNet模型,采用多级扩张坐标增强技术和多层混合器来实现皮肤病变的分割
《Digital Signal Processing》:LMM-UNet: A lightweight UNet with multi-dilated coordinate enhanced and multi-level mixer for skin lesions segmentation
【字体:
大
中
小
】
时间:2025年12月19日
来源:Digital Signal Processing 3
编辑推荐:
高精度皮肤病变分割模型LMM-UNet通过MDCE模块增强长程依赖和全局信息提取,MLM模块实现多级特征融合,结合深度监督提升边缘细节,在ISIC、GLaS、JSRT等数据集上验证其轻量化(120k参数)和优越性能。
皮肤病变分割技术是皮肤癌早期检测和精准治疗的重要支撑环节。随着深度学习技术的发展,基于U-Net架构的分割模型在医学影像分析领域取得了显著进展,但仍面临全局上下文信息提取不足和细节丢失等关键问题。本文提出LMM-UNet模型,通过创新模块设计和优化网络结构,有效解决了现有模型的局限性,为临床诊断提供了新的技术路径。
在现有技术分析方面,传统方法主要依赖阈值分割、区域生长等传统图像处理技术,或采用支持向量机等机器学习方法,这些方法在复杂皮肤图像场景中表现欠佳。虽然深度学习尤其是U-Net架构在医学图像分割领域取得突破,但现有模型仍存在明显缺陷:首先,标准卷积操作在空间维度上的信息传递存在局限性,难以有效捕捉跨像素的长期依赖关系;其次,多尺度特征融合机制不完善,导致小病灶区域的细节信息在编码过程中逐渐丢失;再次,解码阶段的特征融合方式单一,未能充分利用不同层级的上下文信息。这些技术瓶颈严重制约了模型在临床实践中的推广价值。
针对上述问题,本文创新性地提出双模块协同优化方案。MDCE模块通过融合空间维度的多尺度特征提取技术,构建了双向协同的特征增强机制。在横向空间方向,采用可变膨胀率的卷积核设计,使每个滤波器具有不同的空间感受野,既能保留局部纹理特征,又能捕获大范围组织分布规律。在纵向特征通道方向,引入分层特征融合策略,通过通道加权机制将不同深度特征进行有效整合。这种双维度协同的特征提取方式,在保持计算效率的同时显著提升了模型对病变边缘和微小结构的识别精度。
MLM模块作为模型的核心创新点,建立了多层级特征交互的动态调节机制。该模块通过构建双向通道注意力网络,在解码阶段实时优化特征融合权重。具体而言,在横向空间维度上,采用位置编码技术增强特征的空间定位能力;在纵向特征维度上,设计可学习的通道权重分配机制。这种分层融合策略不仅解决了传统U-Net跳跃连接导致的噪声传播问题,还能根据病变区域的具体形态动态调整特征融合比例,在保证整体计算量(仅120k参数)的前提下,显著提升了分割结果的边缘清晰度和细节保留能力。
模型架构设计充分借鉴了Transformer的自注意力机制优势,同时保持了U-Net的核心架构特征。编码器部分的前三层采用标准卷积提取基础特征,后三层集成MDCE模块,通过多级膨胀卷积和空间编码技术,同步获取病灶区域的全局上下文和局部细节特征。解码器采用逆向结构设计,前三层解码器通过MDCE模块实现跨尺度特征交互,后三层则采用轻量化卷积进行精细分割。这种张弛有度的结构设计,既保证了模型对全局和局部特征的平衡处理能力,又有效控制了计算复杂度。
在模型训练策略方面,本文创新性地引入了深度监督机制。通过在解码阶段生成多级中间预测结果,并与下采样后的真实标签进行对比优化,有效引导模型学习更稳定的特征表达。实验表明,这种监督方式能显著提升模型的泛化能力,尤其在处理形状不规则或边界模糊的病变区域时,模型能自主识别关键特征并进行动态调整。
实验验证部分选取了四个具有代表性的医学影像数据集:ISIC 2017(2150例)、ISIC 2018(2694例)、GLaS(覆盖多种皮肤病变类型)和JSRT(侧重基底细胞癌检测)。在对比实验中,LMM-UNet模型在IoU指标上分别达到0.892(ISIC 2017)、0.885(ISIC 2018)、0.876(GLaS)和0.881(JSRT),较传统U-Net模型提升约15%-20%。特别值得关注的是,在JSRT数据集中,该模型对直径小于2mm的微小病变的识别准确率达到91.3%,较现有最优模型提升4.6个百分点。
模型优化效果主要体现在三个方面:其一,MDCE模块通过多尺度膨胀卷积和空间编码的协同作用,使特征提取范围从传统3x3卷积的9像素扩展到75像素(最大膨胀率12倍),同时保持计算量不变;其二,MLM模块的双向注意力机制,使特征融合效率提升约40%,有效解决了深层特征退化问题;其三,动态深度监督机制将训练过程从简单的端到端优化升级为多阶段协同学习,显著增强了模型对复杂场景的适应能力。
在临床应用场景中,该模型展现出显著的技术优势。实测数据显示,模型在处理边界模糊的脂溢性角化症时,分割边缘的定位误差小于0.5mm;对于颜色分布复杂的恶性黑色素瘤,其特征提取能力较传统模型提升32%;在移动端部署测试中,模型在iPhone 14 Pro Max设备上实现推理速度达35.7FPS,满足实时辅助诊断需求。更值得关注的是,模型在低光照、高噪 interfere等恶劣工况下的性能稳定性,较现有模型提升约18%,这对基层医疗机构的应用具有重大意义。
技术突破体现在特征交互机制的创新设计。传统U-Net的跳跃连接虽然缓解了细节丢失问题,但存在两个根本性缺陷:一是将编码器特征直接平铺融合,导致高频噪声传播;二是缺乏自适应调节机制,难以应对不同形态的病变区域。LMM-UNet通过MDCE模块构建了空间-通道双维度的特征增强网络,其中可变膨胀率的卷积核组实现了从局部到全局的多尺度特征整合,而空间编码模块则通过1D卷积提取每个像素的定位特征向量。这种双通道特征融合方式,使得模型既能捕捉病变区域的整体分布规律,又能精准定位细微结构。
在模型轻量化设计方面,团队采用了分层剪枝策略。通过分析不同层级的特征重要性,对重复性计算模块进行智能压缩。例如,在MDCE模块中,将最大膨胀率从12调整至8倍,在保证性能的前提下减少约25%的计算量。同时,采用通道共享的多层感知机结构替代传统MLP堆叠,使通道权重计算复杂度降低60%。这种精细化的模型优化策略,使得最终参数量控制在120k以内,显著优于同类轻量化模型。
实验对比部分揭示了LMM-UNet的技术优势。在ISIC 2018数据集上,与主流模型对比显示:模型在整体准确率(OA)达到97.2%的同时, dice系数提升至0.941,边界定位误差减少至0.38mm。特别是在处理混合型病变(同时存在角化过度和色素痣)时,模型的多尺度特征融合能力使其分割结果的一致性提高约27%。值得注意的是,该模型在资源受限的边缘计算设备(如Jetson Nano)上仍能保持90%以上的性能衰减,充分体现了模型的泛化能力。
临床验证环节采用三甲医院真实病例数据(2023年1月-6月期间诊断的472例皮肤病变),结果显示模型在早期癌变检测中敏感度达96.8%,特异性为94.3%,与资深医师的诊断结果吻合度达92.5%。在基层医疗机构的实地测试中,模型处理速度达到每秒12帧,误检率控制在1.2%以下,充分验证了其临床实用价值。
未来研究方向建议在三个方面深化:首先,探索结合生成对抗网络(GAN)的预训练方法,进一步提升模型在罕见病变类型中的识别能力;其次,研究模型与病理报告的自动化关联系统,构建完整的AI辅助诊断链条;最后,开发面向移动端优化的轻量化推理框架,实现模型在智能终端的实时部署。这些技术延伸将进一步提升模型在真实临床场景中的实用价值。
该研究的创新价值不仅体现在技术突破,更在于建立了新型医学影像分析的开发范式。通过模块化设计实现功能解耦,既保证了模型的可解释性,又为后续功能扩展预留了接口。在医疗AI领域,这种模块化、轻量化、可解释的设计理念具有重要借鉴意义。实验数据显示,该模型在ISIC数据集上的推理速度达到2.8ms/pixel,内存占用仅58MB,完全满足临床实时性要求,为建立标准化AI辅助诊断系统奠定了基础。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号