SkinEHDLF:创新混合深度学习模型助力精准皮肤癌分类

【字体: 时间:2025年04月29日 来源:Scientific Reports 3.8

编辑推荐:

  皮肤癌严重威胁全球公共健康,早期精准检测至关重要。研究人员开展 SkinEHDLF 模型研究,以提升皮肤癌分类准确性。该模型融合多种先进模型优势,在多指标上表现优异,能有效区分良恶性病变,为皮肤癌诊断提供新方案。

  在全球范围内,皮肤癌如同潜伏在暗处的 “健康杀手”,每年都有大量新增病例。其中,黑色素瘤(melanoma)、基底细胞癌(basal cell carcinoma,BCC)和鳞状细胞癌(squamous cell carcinoma,SCC)是主要类型,尤其是黑色素瘤,若未能及时发现和治疗,极易扩散至其他器官,严重威胁生命健康。
传统的皮肤癌检测方法,如皮肤科医生的视觉评估和活检操作,存在诸多弊端。视觉评估主观性强、易受医生经验影响,活检不仅耗时、有创,还可能给患者带来额外痛苦。随着医疗技术的发展,机器学习(ML)和深度学习(DL)技术逐渐应用于皮肤癌诊断领域,但仍面临诸多挑战。例如,数据标注困难、不同肤色人群皮肤病变表现差异大、模型易出现假阳性和假阴性结果等。为了解决这些难题,提高皮肤癌检测的准确性和可靠性,来自印度 Galgotias 大学等机构的研究人员开展了关于 SkinEHDLF 模型的研究。相关研究成果发表在《Scientific Reports》上,为皮肤癌的诊断带来了新的曙光。

研究人员采用了一系列关键技术方法。在数据方面,使用了 ISIC 2024 数据集,该数据集包含 401,059 张从 3D 全身摄影中提取的高分辨率皮肤病变图像,涵盖多种皮肤病变类型、不同光照条件和患者特征。在模型构建上,SkinEHDLF 模型融合了 ConvNeXt、EfficientNetV2 和 Swin Transformer 三种先进模型的优势,并引入自适应注意力机制进行特征融合。同时,运用了数据预处理技术,包括图像增强、归一化和标准化等,以提高数据质量和模型性能;采用网格搜索(Grid Search)和 K 折交叉验证(K-fold cross-validation)进行超参数调优,确保模型达到最佳状态。

实验结果


  1. 病变类型分类性能:在对黑色素瘤、BCC、鳞状细胞癌和良性病变的分类中,SkinEHDLF 模型表现出色。黑色素瘤分类的准确率达 98.4% ,精度为 98.7% ,召回率 98.1% ,F1 分数 98.4% ,AUROC 为 99.2%;BCC 的准确率为 97.9% ,精度 97.4% ,召回率 98.2% ,F1 分数 97.8% ,AUROC 为 98.5%;鳞状细胞癌的准确率 97.5% ,精度 96.8% ,召回率 98.0% ,F1 分数 97.4% ,AUROC 为 98.1%;良性病变的准确率 99.1% ,精度 99.3% ,召回率 98.9% ,F1 分数 99.1% ,AUROC 高达 99.4%。这表明该模型能有效区分不同类型的皮肤病变。
  2. 混淆矩阵分析:在二元分类(恶性与良性)任务中,SkinEHDLF 模型准确率达 98.76% ,精度 99.2% ,AUROC 为 99.8% ,远超其他对比模型;在多分类(黑色素瘤、良性和非癌性)任务中,AUROC 为 99.7% ,准确率 98.6% ,同样表现卓越,显示出该模型在不同分类任务中的可靠性和适应性。
  3. 解剖部位性能分析:针对不同解剖部位的皮肤病变,如头颈部、上肢、下肢和躯干,SkinEHDLF 模型均表现出较高的准确率、精度、召回率和 AUROC。头颈部病变分类准确率为 98.2% ,上肢为 97.8% ,下肢为 97.5% ,躯干最高达 98.6% ,表明该模型不受病变位置影响,具有良好的鲁棒性。
  4. 跨数据集和跨领域性能评估:在不同数据集(ISIC 2024、ISIC 2020、HAM10000 和 Dermofit)上进行测试,模型在 ISIC 2024 数据集上表现最佳,准确率 98.8% ,精度 98.9% ,AUROC 99.3% 。在其他数据集上,虽准确率有所下降,但仍保持较高的 AUROC 分数,说明模型有一定泛化能力,但还需针对不同数据集进行微调。
  5. 误差分析和噪声鲁棒性:随着噪声水平增加,模型性能虽有所下降,但仍保持一定有效性和鲁棒性。在无噪声时,准确率 98.76% ,精度 98.87% ,召回率 98.45% ;在 5% 低高斯噪声下,准确率仍有 97.6% ,模型能在一定噪声环境下保持较好的检测能力。
  6. K 折交叉验证性能和统计分析:通过 10 折交叉验证,模型在各指标上表现稳定。准确率在 98.6 - 99.1% 之间,精度约 97% ,召回率约 96% ,AUROC 和 AUC 在 0.992 - 0.995 之间,表明模型具有较高的可靠性和稳定性。
  7. 数据预处理的影响:数据预处理显著提升了 SkinEHDLF 模型性能。预处理后,准确率从 95.8% 提升到 98.9% ,精度从 92.6% 提升到 97.6% ,召回率从 90.2% 提升到 96.4% ,同时降低了 FPR 和 FNR,说明数据预处理对提高模型性能至关重要。
  8. 消融研究和组件贡献分析:通过消融研究发现,单独使用 ConvNeXt、EfficientNetV2 或 Swin Transformer 时,模型准确率在 94.2 - 95.4% 之间;而组合使用时,模型性能显著提升,完整的 SkinEHDLF 模型准确率达 98.8% ,精度 97.6% ,召回率 96.9% ,证明了融合多种模型的重要性。
  9. 超参数调整和敏感性分析:调整超参数(如学习率、批量大小、优化器等)对模型性能有显著影响。例如,使用 Adam 优化器,学习率 0.0001,批量大小 64,训练 200 个 epoch,dropout 率 0.5,10 层网络时,模型准确率可达 99.75% ,表明合理调整超参数可优化模型性能。
  10. ROC - AUC 分析和比较评估:ROC - AUC 分析显示,SkinEHDLF 模型在不同年龄组(儿童、年轻成人、成人和老年人)中均表现良好,能有效区分恶性和良性病变。各年龄组的 AUROC 和 AUC 分数接近 0.99,敏感性和特异性较高,MAE 和 MSE 较低,说明模型在不同年龄人群中都具有较高的准确性。

研究结论与讨论


研究表明,SkinEHDLF 模型在皮肤癌分类任务中表现优异,在二元分类和多分类任务中均取得了高准确率,在不同解剖部位、不同数据集和不同噪声条件下都展现出良好的性能和鲁棒性。数据预处理对模型性能提升有重要作用,消融研究证实了融合多种模型的优势。然而,该研究也存在一定局限性。数据集的多样性和代表性不足,可能影响模型在不同人群中的泛化能力;缺乏对罕见病变类型的充分评估;模型在临床环境中的实时性能和适用性还需进一步验证。尽管如此,SkinEHDLF 模型为皮肤癌诊断提供了新的可靠方案,未来通过扩大数据集、开展临床部署和整合多模态数据等研究,有望进一步提升其性能和临床应用价值,为皮肤癌的早期诊断和治疗带来更多希望,推动皮肤科诊断领域的发展,提高患者的生存率和生活质量。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号