基于状态空间建模和卷积感知的皮肤病变分割网络

《Engineering Applications of Artificial Intelligence》:Skin lesion segmentation network based on state space modeling and convolutional perception

【字体: 时间:2025年11月22日 来源:Engineering Applications of Artificial Intelligence 8

编辑推荐:

  皮肤病变分割面临不规则形状、尺度变化和边界模糊的挑战,SCE-Net通过双分支编码器整合CNN的局部纹理和VSSM的全球依赖,结合动态融合模块与边缘引导机制优化边界精修,在四个数据集上显著提升分割指标,验证了多模态融合的有效性。

  
陈浩|丁卫平|王哲|张海飞
中国南通市南通理工学院信息工程学院,226002

摘要

皮肤病变的精确分割对于计算机辅助诊断和治疗计划至关重要,但由于病变形状不规则、尺度变化以及边界模糊,这一任务仍然具有挑战性。这些因素使得模型难以在保留细粒度局部细节的同时捕捉到长距离的语义上下文。为了解决这个问题,我们提出了一种基于边缘感知的分割网络,该网络将卷积特征感知与视觉状态空间建模相结合。该网络采用双分支编码器来平衡局部纹理和边缘的表示与全局语义依赖性,而轻量级的边界细化模块则在解码阶段增强了轮廓的清晰度。这种设计缓解了状态空间建模在捕捉局部细节方面的不足,并提高了边界定位的准确性。我们在四个公开可用的数据集上评估了所提出的方法,并将其与先进的分割方法进行了比较。实验结果表明,我们的网络在Dice相似系数和交并比方面始终表现出更高的性能,并且95%的Hausdorff距离也更小。此外,统计测试证实了这些改进的显著性,为我们的皮肤病变分割方法的有效性提供了有力证据。源代码可在https://github.com/Randy158/SCE_Net获取。

引言

医学图像分割是计算机辅助诊断中的核心技术,在肿瘤检测、器官轮廓勾画和手术规划等临床场景中得到广泛应用。其目标是在医学图像中精确地勾画解剖结构或病理区域(Azad等人,2024;Litjens等人,2017;Zhang等人,2025)。
由于黑色素瘤发病率的上升(Daugaard等人,2025),皮肤病变分割受到了越来越多的关注,而黑色素瘤是皮肤癌死亡的主要原因。准确勾画病变区域对于早期诊断和治疗计划至关重要,但由于病变通常具有不规则的形状、尺度变化和模糊的边界,这仍然是一个挑战(Li等人,2024;Mirikharaji等人,2023)。
近年来,卷积神经网络(CNN)在医学图像分割领域取得了显著进展。基于CNN的方法,如U-Net(Ronneberger等人,2015)及其变体(Gu等人,2019;Huang等人,2020;Hussain等人,2025),通过利用多尺度特征聚合取得了显著成果。增强U-Net的一种常见策略是引入更强大的骨干网络,如残差网络(ResNet)(He等人,2016)来加强特征提取。例如,CE-Net(Gu等人,2019)使用ResNet作为编码器,并通过孔洞卷积改进了上下文建模,而DFF-UNet(Khan和Khan,2025)结合了残差细化和金字塔模块来提升皮肤病变分割能力。然而,CNN的感受野有限,难以捕捉长距离的依赖关系。
为了克服这一限制,基于Transformer的架构引入了自注意力机制用于全局上下文建模(Liu等人,2025;Ozcan等人,2024),并已成功应用于皮肤病变分析(Wang等人,2025;Xu等人,2024)。然而,它们的二次计算成本限制了在高分辨率图像上的效率。最近,状态空间模型(SSM)(Gu和Dao,2024)被提出作为CNN和Transformer的有希望的替代方案,它具有线性计算复杂度并能够建模长距离依赖关系。例如,VM-UNet(Ruan等人,2024)将视觉状态空间模块(VSSM)集成到非对称的编码器-解码器中,而自适应上下文聚合策略(Zhu等人,2025)进一步结合了全局和局部线索。
尽管取得了这些进展,皮肤病变分割仍面临挑战。现有的基于CNN、Transformer和SSM的模型仍然难以同时捕捉细粒度的局部细节和全局结构。混合和双分支框架(Li等人,2024;Tan等人,2024;Yuan等人,2024)试图将局部CNN特征与全局上下文表示相结合。然而,许多现有设计仍然依赖于静态融合策略(Qamar等人,2025),这限制了它们对异构语义区域的适应性。此外,这些方法在处理模糊的病变边界时往往缺乏鲁棒性。
为了解决上述问题,我们提出了SCE-Net,这是一种旨在平衡局部细节保留和全局上下文建模的皮肤病变分割网络。主要贡献如下:
  • 1.
    双路径协作编码器,结合了一个用于局部纹理的CNN分支和一个用于全局依赖性的VSSM分支,提供了更全面的病变区域表示。
  • 2.
    空间感知增强机制(SEM)和动态融合模块(DFM),其中SEM增强了边缘和纹理的敏感性,而门控DFM实现了跨尺度的像素级自适应特征集成。
  • 3.
    解码器中嵌入的边缘引导机制(EGM),用于生成边缘注意力图,细化模糊的边界并改善轮廓连续性。
本研究的其余部分安排如下:第2节概述了基于CNN、基于Transformer和基于SSM的方法,以及最近的混合设计用于皮肤病变分割。第3节描述了所提出的方法,包括整体架构、双分支编码器、动态融合模块、边缘注意力引导以及解码和输出阶段。第4节报告了实验结果,包括数据集描述、实现细节、与先进方法的比较、消融研究以及结果讨论。第5节总结了本研究。

章节片段

相关工作

在本节中,我们回顾了通过主流技术方法在皮肤病变分割方面的研究进展。这些方法包括基于CNN的方法、基于Transformer的方法、基于SSM的方法以及最近的混合设计。
基于CNN的架构,如U-Net及其改进的变体,在医学图像分割方面取得了显著进展,包括皮肤病变分析(Khan和Khan,2025;Sharen等人,2024)。引入注意力机制的扩展提高了网络对病变的关注度

架构概述

皮肤病变分割面临几个挑战,包括边界不清晰、全局和局部信息建模之间的不平衡以及多尺度特征整合不足。为此,我们引入了SCE-Net,这是一种新的分割框架。它将状态空间建模与卷积感知相结合,以提高分割精度。整体架构如图1所示。该网络由两个并行编码分支、一个动态融合模块组成

数据集

ISIC 2017数据集(Codella等人,2018)由国际皮肤成像合作组织发布,是一个大规模的皮肤镜图像数据集。具体来说,该数据集包含了2000张皮肤镜图像及其对应的分割掩码。PH2(Barata等人,2013)数据集包含200张彩色皮肤镜图像,其中包括80个常见痣、80个非典型痣和40个黑色素瘤。DermIS(2023)数据集包含69张临床图像,其中26个痣和43个黑色素瘤。

结论

皮肤病变分割是计算机辅助皮肤科诊断中的基本任务。准确勾画病变区域对于早期检测和治疗皮肤癌至关重要。本研究通过提出一个名为SCE-Net的统一框架,解决了皮肤病变分割中的常见挑战,如边界模糊、尺度变化和结构复杂性。所提出的网络采用了一个由CNN组成的双分支编码器

CRediT作者贡献声明

陈浩:撰写——原始草稿、软件、方法论、研究、资金获取、概念化。丁卫平:撰写——审阅与编辑、监督、资源、项目管理。王哲:可视化、研究。张海飞:验证、形式分析。

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能影响本文所述的工作。

致谢

本项工作得到了南通社会 livelihood 科学技术计划(指令项目)(资助编号:MS2024019)的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号