利用基于SE-ViT的生成网络在数据不平衡的情况下实现可解释的黑色素瘤检测

《Biomedical Signal Processing and Control》:Explainable melanoma detection using SE-ViT-based generative networks for imbalanced data

【字体: 时间:2025年11月25日 来源:Biomedical Signal Processing and Control 4.9

编辑推荐:

  皮肤癌早期诊断面临数据不平衡、图像质量差和传统方法效率低的问题,本文提出SE-ViT-DAPGAN模型,通过自适应滤波预处理和生成对抗网络增强数据,结合视觉Transformer和SE模块提升特征提取能力,并利用Grad-CAM等可解释AI技术提高诊断透明度。实验表明该方法在准确率、召回率等指标上优于现有方法,有效处理数据不平衡并提升早期检测效果。

  
Rishi Agrawal|Neeraj Gupta|Anand Singh Jalal
印度北方邦马图拉市GLA大学计算机工程与应用系

摘要

黑色素瘤是一种恶性皮肤癌,是全球主要的健康问题。早期和准确的诊断对于改善患者预后至关重要。目前,皮肤癌的诊断主要依赖于视觉方法,如皮肤镜检查、临床筛查和组织病理学分析。然而,这些技术往往效率低下、成本高昂且准确性不稳定。为了解决这些问题,提出了一种基于SE-ViT生成网络的不平衡数据黑色素瘤检测方法(MSCD-SEViT-DAPGAN)。首先,从HAM10000、ISIC和PH2数据集中收集输入数据。收集的数据通过自适应快速去敏卡尔曼滤波器进行预处理,以实现数据标准化和增强,并平衡不同类型的皮肤癌,从而减轻数据不平衡问题。预处理后的数据被输入到基于挤压-激励视觉变换器的深度自适应感知生成对抗网络(SEViT-DAPGAN)中,以检测和分类皮肤癌为黑色素瘤或非黑色素瘤。最后,使用可解释AI(XAI)方法(如Grad-CAM、LIME和遮挡敏感性)在保持高预测准确性的同时提供更易于解释的结果。通过准确性、召回率、精确度和F1分数等性能指标评估了MSCD-SEViT-DAPGAN的有效性。实验结果表明,与现有方法相比,该方法能够高效地对皮肤癌进行分类,并有效处理不平衡数据。

引言

无论年龄或皮肤类型如何,全球有数百万人患有皮肤癌(SC),这是一个严重的公共卫生问题[1]。黑色素瘤,也称为恶性黑色素瘤,是最致命的皮肤癌类型[2]。其主要原因是长期暴露在紫外线下,这会引发产生黑色素的黑色素细胞的改变[3]。皮肤上的深色痣是这些改变的结果,导致细胞产生更多黑色素[4]。这些病变或痣最终会发展成恶性肿瘤,并扩散到身体的其他部位[5]。如果不加以控制,它们会对人的健康和福祉构成严重威胁[6]。在美国,皮肤癌的发病率现在为每10万人中有23例[7]。早期发现和适当的治疗可以显著降低与黑色素瘤相关的发病率和死亡率[8]。多项研究表明,在早期阶段检测黑色素瘤可以提高预测准确性,增加成功治愈的概率[9]。因此,早期检测和准确诊断对于提高黑色素瘤的生存率至关重要[10]。最近有人尝试开发计算机辅助方法来评估皮肤病变[11]。一种流行的方法是通过“ABCD”规则来分析不对称性、边界变化、颜色不均匀以及某些皮肤镜特征。然而,黑色素瘤照片存在对比度低、噪声和边界不均匀等问题,使得医疗专业人员难以在每个病例中准确识别该疾病[4]。根据黑色素瘤研究基金会的数据,仅应用ABCD指南并不总能得出准确的黑色素瘤诊断结果。
黑色素瘤是最致命的皮肤癌类型,早期和准确的诊断对于提高患者生存率至关重要。传统的诊断方法(如皮肤镜分析和组织病理学检查)耗时较长,受观察者间差异的影响较大,且依赖于专家的专业知识。这些挑战常常导致诊断延迟或错误。黑色素瘤病变具有复杂的视觉特征,如边界不规则、颜色模式多样、对比度低,使得手动分类变得困难且容易出错。因此,迫切需要可靠的自动诊断工具来支持早期黑色素瘤检测并减少误诊。利用先进的计算方法有助于克服手动技术的局限性,提高诊断的一致性,最终改善皮肤科的临床决策。由于图像质量问题、类别不平衡以及皮肤镜和组织病理学等传统诊断方法的局限性,黑色素瘤是一种严重且可能致命的皮肤癌类型,其在早期识别方面面临重大挑战[31],[32],[33]。
本研究的新颖之处在于将挤压-激励(SE)机制与视觉变换器(ViT)创新性地集成到深度自适应感知生成对抗网络(DAPGAN)框架中,用于黑色素瘤的识别和分类。与传统基于CNN的模型不同,该架构利用了ViT的全局注意力机制,并通过SE模块增强特征重新校准,使方法能够动态关注与诊断相关的皮肤病变特征。引入感知损失引导的GAN不仅有助于高质量图像的合成和数据增强,还优化了特征空间,从而实现稳健的分类。这种协同组合显著提高了诊断准确性,特别是在标注医学图像有限的情况下,为自动化黑色素瘤分析树立了新的基准。
本研究的主要贡献包括:
  • 应用自适应快速去敏卡尔曼滤波器(AFDKF)进行数据标准化并提高不平衡数据上的检测准确性。
  • 集成视觉变换器和挤压-激励(SE)模块,有效捕捉皮肤镜图像中的局部和全局依赖关系
  • 提出SEViT-DAPGAN(基于挤压-激励视觉变换器的深度自适应感知GAN)以实现稳健的特征提取和分类。
  • 通过注意力图和激活图提供视觉解释,强调临床可信度和透明度
  • 通过动态加权特征和分类高风险黑色素瘤区域,重点关注早期检测并减少假阳性/假阴性
  • 章节片段

    文献综述

    在本节中,回顾了一些最新的关于皮肤癌黑色素瘤检测和分类的研究成果。
    Gururaj等人[12]提出了一个基于深度学习的先进框架,用于皮肤癌的分类。他们提出了一种基于早期识别和准确检测的通用预防策略。近年来,深度学习在皮肤癌检测方面越来越受欢迎

    提出的方法

    该方法首先使用ViTDapGAN识别皮肤癌黑色素瘤,有效的黑色素瘤识别和分类包括一个完整的流程,从ISIC或HAM10000等数据集获取皮肤镜图像开始。
    图1展示了SEViT-DAPGAN框架的框图。它显示了皮肤镜图像经过AFDKF预处理,随后进行数据增强以平衡不同类别。该框架集成了SE模块、视觉变换器和GAN

    结果与讨论

    性能通过性能指标进行评估。AUC曲线是一个图表,通过绘制特定阈值水平下的真正例率和假正例率来表示二元分类。AUC值将ROC曲线概括为一个数字:得分为1表示方法表现完美,得分为0.5表示模型的性能与随机猜测相当。表3列出了实验设置和超参数设置

    结论

    SEViT-DAPGAN框架成功实现了皮肤癌的准确检测和分类,特别是黑色素瘤。这种混合方法有效应对了图像噪声、类别不平衡和标注数据稀缺等挑战,同时通过可解释AI技术提高了临床可解释性,证明了该模型是一种稳健且可扩展的早期黑色素瘤诊断解决方案。尽管如此,该模型仍存在一些局限性,例如对高质量数据的依赖性

    作者贡献声明

    Rishi Agrawal:撰写原始草稿。Neeraj Gupta:监督。Anand Singh Jalal:监督。

    利益冲突声明

    作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。
    相关新闻
    生物通微信公众号
    微信
    新浪微博
    • 搜索
    • 国际
    • 国内
    • 人物
    • 产业
    • 热点
    • 科普
    • 急聘职位
    • 高薪职位

    知名企业招聘

    热点排行

      今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

      版权所有 生物通

      Copyright© eBiotrade.com, All Rights Reserved

      联系信箱:

      粤ICP备09063491号