基于混合 YOLOv8 与视觉 Transformer(ViT)的多类皮肤癌自动可解释深度学习检测与分类框架

【字体: 时间:2025年04月30日 来源:Biomedical Signal Processing and Control 4.9

编辑推荐:

  为解决皮肤癌检测中数据集不平衡、模型决策缺乏可解释性等问题,研究人员开展基于混合 YOLOv8 和视觉 Transformer(ViT)的多类皮肤癌检测与分类研究。结果显示 ViT 与 YOLOv8 结合性能提升,该研究有助于提高临床诊断准确性。

  

研究背景


皮肤癌,作为当今常见的癌症类型之一,严重威胁着全球无数人的健康。它主要由皮肤细胞在紫外线(UV)的长期照射下发生异常增殖引发,可分为非黑色素瘤和黑色素瘤两大类型。其中,黑色素瘤虽然发病率相对较低,仅占皮肤癌的 5%,但其致死率却极高。一旦黑色素瘤发生转移,患者的生存几率会急剧下降,晚期诊断时生存率≤14%。而非黑色素瘤皮肤癌,像鳞状细胞癌(SCC)和基底细胞癌(BCC),虽然致死率相对较低,但由于其占皮肤癌病例的 95%,整体患病人数众多,同样不可忽视。

目前,传统的皮肤癌诊断方法面临诸多困境。手动诊断依赖经验丰富的皮肤科医生,通过 ABCD 规则(评估不对称性、边界不规则性、颜色不均匀性和特定皮肤镜结构)进行判断,但实际操作中,黑色素瘤图像常存在低对比度、噪声和不规则边界等问题,这使得诊断准确性大打折扣,容易出现误诊情况。此外,组织病理学检查虽被视为 “金标准”,但该方法耗时费力,不同病理学家之间的解读差异也会导致诊断不一致。而且,在过往的研究中,多数皮肤癌诊断模型存在两大关键缺陷:一是未将感兴趣区域(ROI)定位作为分类的初步步骤;二是没有有效解决数据集不平衡问题,同时模型决策的可解释性也未得到充分研究。鉴于此,开展新的皮肤癌诊断研究迫在眉睫。

研究概况


为攻克这些难题,来自国外的研究人员开展了一项基于混合 YOLOv8 和视觉 Transformer(ViT)的多类皮肤癌自动可解释深度学习检测与分类框架的研究。该研究成果发表在《Biomedical Signal Processing and Control》杂志上。研究旨在提高皮肤癌分类的准确性,探索数据增强技术对不平衡数据集的改善效果,以及提升模型的可解释性。研究人员构建了一个端到端的可解释框架,涵盖数据预处理、数据增强、区域定位和模型微调等多个关键环节。通过一系列实验,研究人员发现将 YOLOv8 与 ViT 相结合,能显著提升模型性能,在皮肤癌检测和分类方面取得了更好的效果,这对于提高临床诊断准确性具有重要意义。

关键技术方法


研究主要采用了以下几种关键技术方法:

  1. 数据增强技术:为解决数据集不平衡问题,研究人员采用了平衡比率控制和比率阈值化两种数据增强策略,增加少数类样本的代表性,提高模型泛化能力,减少过拟合。
  2. YOLOv8 模型:利用 YOLOv8 强大的目标检测能力,对皮肤病变区域进行精准定位,排除无关区域,提升模型对关键特征的关注度,为后续分类任务奠定基础。
  3. 预训练模型微调:对包括 ViT 在内的 8 种不同的预训练模型进行微调,进一步优化模型性能,以适应皮肤癌检测的特定任务。
  4. 可解释性分析方法:运用 Grad-CAM(梯度加权类激活映射)和 SHAP(SHapley Additive exPlanations)值方法,从空间和模型特征层面深入分析模型决策过程,提高模型的可解释性。

研究结果


  1. 病变定位与数据增强效果:通过消融研究对比了 YOLOv8 在不同数据集(原始训练集、平衡比率控制增强数据集、比率阈值化增强数据集)上的平均精度均值(mAP)。使用 mAP50 和 mAP50 - 95 两个阈值评估发现,数据增强技术有效提升了 YOLOv8 的检测性能,证明了数据增强策略在改善数据集不平衡问题上的有效性。
  2. 模型性能对比:研究人员对 8 种预训练模型进行微调后评估其性能,发现 ViT 与 YOLOv8 相结合时,在平衡精度、召回率和 F1 分数等指标上表现出色,达到了 93%,显著优于独立的 ViT 模型,充分显示出该混合模型在皮肤癌检测与分类任务中的优势。
  3. 模型可解释性提升:借助 Grad-CAM 和 SHAP 值方法,研究人员能够清晰地展示模型在做出决策时关注的图像区域和关键特征。Grad-CAM 突出了影响预测的图像区域,提供了空间层面的见解;SHAP 值则在模型层面量化了特征的重要性,两者结合使模型决策过程更加透明、可靠。

研究结论与意义


本研究成功构建了一个端到端的可解释皮肤癌检测框架,有效填补了现有研究的空白。在数据处理方面,多种数据增强技术成功平衡了数据集,减少了不平衡数据带来的偏差;在模型构建上,YOLOv8 对感兴趣区域的精准定位和 8 种预训练模型的微调显著提升了系统的性能和稳健性;在模型解释上,Grad-CAM 和 SHAP 值方法的应用,为深入理解模型决策过程提供了有力支持,增强了模型的透明度和可靠性。

该研究成果对于临床实践意义重大。一方面,为皮肤科医生提供了更精准、高效的辅助诊断工具,有助于提高皮肤癌的早期诊断准确率,从而提高患者的生存率;另一方面,其可解释性特点有助于医生更好地理解模型决策依据,增强对诊断结果的信任度,促进人工智能技术在医学领域的广泛应用。同时,本研究也为后续相关研究提供了重要的参考和借鉴,推动皮肤癌检测技术朝着更智能化、精准化的方向发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号