SGO-DRE:一种基于《鱿鱼游戏》优化思想的集成方法,用于实现准确且可解释的皮肤病诊断

《CMES - Computer Modeling in Engineering and Sciences》:SGO-DRE: A Squid Game Optimization-Based Ensemble Method for Accurate and Interpretable Skin Disease Diagnosis

【字体: 时间:2025年10月10日 来源:CMES - Computer Modeling in Engineering and Sciences

编辑推荐:

  皮肤疾病诊断的精准性受传统方法耗时长、易出错及单模型性能限制影响。本文提出Squid Game优化-维度缩减集成(SGO-DRE)方法,融合MobileNetV1、DenseNet201、Xception三模型特征提取,通过维度缩减块优化计算效率,并利用Squid Game优化算法动态调整模型权重,实现高效联合诊断。实验表明,该方法在8类、6类和4类皮肤疾病数据集上分别达到98.71%、96.34%和93.46%的准确率,并借助Grad-CAM可视化验证模型决策可解释性,优于现有CNN和优化算法组合方法。

  皮肤疾病的及时准确诊断对于医疗健康领域至关重要,因为传统方法往往耗时且容易出错。在皮肤疾病诊断过程中,许多模型的组合通常采用试错方法,但这会导致性能不佳。为了解决这些问题,我们提出了一种基于鱿鱼游戏优化和降维的集成方法(SGO-DRE),用于提高皮肤疾病的诊断精度。本研究首先选择预训练模型MobileNetV1、DenseNet201和Xception进行稳健的特征提取,这些模型通过引入降维模块来提高效率。为了解决多个模型的集成问题,我们利用了鱿鱼游戏优化(SGO)算法,该算法通过迭代搜索最优的权重组合,为每个模型分配适当的权重,从而在所提出的加权平均集成方法中实现最优的模型预测聚合。这种集成方法有效地利用了每个模型的优势,提升了整体的诊断性能。

我们使用了8类皮肤疾病数据集、6类MSLD数据集和4类MSID数据集对所提出的方法进行了评估,分别取得了98.71%、96.34%和93.46%的准确率。此外,我们还采用了诸如Grad-CAM、ROC曲线和精确率-召回率曲线等可视化工具,以解释模型的决策过程并评估其性能。这些评估不仅确保了所提出方法能够提供稳健的结果,还增强了在临床决策中的可解释性和可靠性。

在研究的引言部分,我们探讨了皮肤疾病诊断的重要性。皮肤癌是各种癌症中最为危险的一种,因其快速增长和高死亡率而成为全球健康威胁。皮肤癌的症状包括新的生长或现有斑点的变化,如大小、形状、颜色的变化,以及可能的瘙痒或出血。自动化的皮肤疾病诊断已成为医学研究的重要领域,特别是在提高临床决策的准确性和效率方面。皮肤疾病从常见的痤疮和湿疹到严重的黑色素瘤,对全球医疗系统造成了显著负担。因此,对这些疾病的及时准确分类对于提供适当的治疗和改善患者预后至关重要。传统诊断方法依赖于皮肤科医生对皮肤镜图像的分析,但在缺乏皮肤科专家的地区,这些方法在可及性、准确性和时间方面存在局限性。皮肤镜是一种专门的诊断技术,通过高级放大来提供皮肤病变的表面和亚表面特征的增强视觉洞察。手动解读皮肤镜图像存在显著挑战,需要大量时间、专业知识来准确分析复杂的皮肤细节,并且识别各种皮肤癌类型可能因外观相似而变得困难。皮肤病变的复杂性使皮肤镜特别困难,因为它需要专业的临床经验和全面的培训来识别细微的皮肤形态变化。这些挑战突显了在医学成像中引入先进的计算诊断方法的必要性,以提高皮肤疾病分类的速度和准确性。因此,开发可靠的计算机辅助诊断(CAD)工具成为当前研究的热点,这些工具能够应对这些挑战并帮助皮肤科医生高效诊断皮肤癌。

深度学习(DL)技术在自动化诊断各种疾病方面展现了巨大潜力。卷积神经网络(CNN)是深度学习中的一种关键技术,已在多种疾病的分类中表现出色,特别是在皮肤疾病诊断中。CNN通过自动提取和解释医学图像中的关键视觉特征,显著提高了皮肤疾病检测的准确性。这些进步使得诸如黑色素瘤和其他皮肤癌的检测更加及时和准确,有助于临床决策的优化。

然而,皮肤癌检测的深度学习模型由于皮肤病变的复杂性和多样性而存在一定的局限性。多尺度特征融合通过结合不同尺度的特征来解决这些挑战,从而提高模型在检测皮肤肿瘤时的诊断能力。单个模型在处理皮肤癌检测的复杂和多样化任务时往往面临局限性,因为它们可能难以捕捉各种皮肤病变中的复杂特征和细微差异。这种局限性突显了集成方法的重要性,其中多个模型被结合以利用每个模型的优势。集成方法可以降低单个模型方法固有的错误风险,提高模型的鲁棒性和复杂模式检测能力。

尽管集成方法可以解决单个模型的不足,但它们需要仔细的优化以达到最佳性能。简单地将模型组合在一起而没有有效的优化技术可能会导致性能不佳。为提高集成方法,网格搜索算法和更高效的启发式算法提供了有效的优化技术。这些方法可以微调集成模型中各个模型的贡献,确保每个模型在最终预测中发挥最大作用。通过使用启发式技术,集成模型变得更加适应皮肤癌诊断的需要。在本研究中,结合多尺度特征融合和启发式优化的优化集成方法设计为皮肤疾病自动诊断提供了一种有前景的方法。这些技术显著提高了皮肤疾病分类的准确性和可靠性,最终为医疗从业者和患者带来更快、更准确的诊断,提高治疗效果并减轻医疗系统的负担。

在方法部分,我们简要讨论了使用的数据集、用于稳健特征提取的模型以及所采用的降维方法。数据集包括来自不同皮肤疾病类别的图像,用于训练和评估模型。为了进行特征提取,我们选择了几个深度学习模型,这些模型设计用于从输入图像中捕捉高层特征。为了提高模型效率,我们采用了朴素的Inception块进行降维处理,有助于减少数据复杂性,同时保留重要的特征信息。此外,我们应用了优化算法以确保训练过程中的更好收敛。最后,所提出的模型方法框架整合了这些技术,通过统一的方法提高分类准确性,从而实现准确的皮肤疾病检测。

数据集的细节部分,我们使用了一个公开的Kaggle数据集,其中包括来自八个不同皮肤疾病类别的图像。该数据集可以通过以下链接下载:https://www.kaggle.com/datasets/subirbiswas19/skin-disease-dataset/data(访问日期:2025年6月1日)。图1展示了8类皮肤疾病数据集中各个皮肤病变类别的代表性样本。我们实施了一种分层数据分割方法,将80%的图像用于模型训练,20%用于严格的性能验证,确保全面且可靠的评估。数据集的分布详见表1,其中提供了每个类别图像的总数,总计1159张图像,支持训练和验证的全面评估。

在预处理和增强部分,我们应用了两种预处理技术。图2a和图2b展示了这些预处理技术。本研究包括图像大小调整、归一化和重缩放。具体来说,我们将图像调整为固定的224×224像素大小,以确保输入大小的一致性。这一步骤有助于减少计算复杂度,并确保数据集的一致性,使模型更容易从图像模式中学习。归一化将像素值缩放到[0,1]范围内,通过除以255来防止训练过程中出现梯度爆炸问题,确保更稳定和更快的收敛。归一化对于CNN尤为重要,因为未归一化的数据可能导致训练过程中的不稳定性。

我们还应用了两种增强技术,以扩展数据集的多样性,提高模型的泛化能力。图2c和图2d展示了这些增强技术。图像增强技术如水平翻转和垂直翻转被应用于数据集,以模拟真实世界中的数据变化。这些变换增加了数据集的多样性,使模型在训练过程中接触更广泛的数据条件,从而学习更通用的特征,提高其在未见过的数据上的表现。

在基线模型选择标准部分,我们选择了MobileNetV1、DenseNet201和Xception三个预训练模型,这些模型在图像分类任务中表现优异,适合用于皮肤疾病分类。这些模型通过整合降维块进一步优化,以减少特征数量,同时保留关键信息。降维有助于提高计算效率,减少参数数量,加快训练过程,并防止过拟合,同时仍然保留模型捕捉复杂特征的能力。

在鱿鱼游戏优化算法部分,我们应用了鱿鱼游戏优化(SGO)算法,以优化集成方法中的权重向量。该算法在约束搜索空间[0,1]^3中进行优化,其中每个模型的权重被限制在0到1之间。其目标是通过迭代调整权重向量来最大化集成模型的性能,从而确保每个模型对最终预测的有效贡献。通过鱿鱼游戏优化算法,所提出的方法能够动态地优化模型的集成,提高分类准确性。

在所提出的SGO-DRE框架概述部分,我们介绍了所提出的SGO-DRE方法,该方法旨在通过结合先进技术提高皮肤癌的诊断性能。该框架整合了预处理、模型选择、降维、模型集成、模型评估和可视化技术。流程从预处理开始,这是确保数据适合模型输入的关键步骤。原始图像被调整为224×224像素的固定分辨率,以确保数据集的统一性和兼容性。图像的像素值被缩放到[0,1]范围,通过除以255来稳定模型训练,加快收敛速度。归一化确保模型能够专注于特征提取,而不是图像大小的差异。

接下来是增强步骤,以增加数据样本的多样性。这有助于提高模型在训练过程中对不同图像条件的适应性,从而提高其在未见过的数据上的表现。这些变换模拟了真实世界中的变化,使模型能够学习更通用的特征。

为了实现稳健的特征提取,我们选择了三个预训练模型,包括MobileNetV1、DenseNet201和Xception,这些模型在图像分类任务中表现优异。这些模型通过整合降维块进一步优化,以减少特征数量,同时保留关键信息。降维有助于提高计算效率,减少参数数量,加快训练和推理速度,并防止过拟合,同时仍然保留模型捕捉复杂特征的能力。

本研究的核心在于使用鱿鱼游戏优化(SGO)算法对所选模型进行集成。SGO算法用于搜索最优的权重分配,确保每个模型在集成中有效贡献。通过迭代优化权重向量,SGO算法使所提出的方法能够充分利用每个模型的优势,提高分类准确性。在模型评估中,我们使用了包含较少和较多图像的数据集,以评估所提出方法在不同数据集规模下的表现。这确保了所提出方法的稳健性和泛化能力,使其能够处理不同复杂度的数据集。

最后,我们使用了可视化技术,如Grad-CAM、ROC曲线和精确率-召回率曲线,以解释和验证模型的预测。Grad-CAM可视化有助于揭示模型在分类决策时关注的图像区域,为临床设置提供透明度和可解释性。ROC和精确率-召回率曲线用于评估模型在不同阈值下的性能,确保其能够平衡精确率和召回率。所提出方法的整体工作流程框架如图7所示。

在结果和实现部分,我们展示了所提出方法的实验结果,重点在于其性能和有效性。我们展示了各种可视化技术以更好地理解结果,并突出了关键观察。此外,我们还将所提出方法与现有方法进行了比较,以展示其优越性和实际优势。实验设置部分,我们使用了一个公开的皮肤疾病数据集进行评估,该数据集提供了多样化的图像和注释,用于皮肤疾病分类。所提出的方法使用Python 3.0+和Keras库进行开发,利用其深度学习能力进行模型训练。训练过程在Jupyter Notebook上进行,使用NVIDIA GeForce MX350 GPU进行加速,该GPU配备2GB GDDR5 VRAM、16GB系统内存和512GB SSD存储。强大的GPU能力使我们能够高效处理大量数据,确保模型更快收敛并更好地处理深度学习模型在皮肤疾病分类中的复杂计算。

模型超参数和评估指标部分,模型的超参数在深度学习模型的训练过程中起着关键作用。这些超参数对模型的学习能力、泛化能力和计算效率有重要影响。超参数的调优对于确保有效学习至关重要,同时避免过拟合或欠拟合的问题。表2展示了用于训练深度学习架构的超参数详细信息。输入图像被调整为224×224像素的大小,以满足模型的规格。为防止过拟合,我们实现了0.4的丢弃率,通过在每个训练批次中随机停用40%的神经元。学习率设定为1.0×10^-3,以根据损失函数的梯度精确调整模型权重。模型使用组归一化(groups=32)进行归一化,以提高训练过程的稳定性。激活函数使用ReLU,以引入非线性,使网络能够学习复杂的模式。在输出层,SoftMax函数将输出转换为概率,用于分类。Adam优化器因其能根据梯度变化动态调整学习率,从而提高训练效率而被优先选择。我们还结合了模型检查点、早停和学习率调度器等回调函数。选择64的批量大小以确保高效的内存使用,模型在20个周期内进行训练,以有效分析数据集并提高其学习复杂特征的能力。

类别的性能评估部分,类别的性能分析对于评估模型在不同类别之间的区分能力至关重要。它有助于确保模型在所有类别中都表现出色,并突出需要改进的领域。表3提供了基线模型MSF1(MobileNetV1 + NB)、MSF2(DenseNet201 + NB)、MSF3(Xception + NB)和所提出方法的详细类别性能。MSF1模型在Impetigo、Nail-fungus和Chickenpox类别中实现了完美的召回率,表明其在正确分类这些类别方面具有很强的能力。然而,该模型在Ringworm类别中面临挑战,导致召回率较低。其他类别显示出合理的召回率,表明其在大多数类别中表现良好。总体而言,MSF1模型在所有类别中实现了96.57%的高准确率,表明其有效性,尽管在某些类别中还有改进空间。

MSF2模型在Impetigo、Nail-fungus、Ringworm和Shingles类别中表现出色,实现了完美的召回率,表明其在正确识别这些4类中的能力。尽管如此,该模型在Athlete-foot类别中面临挑战,导致召回率较低。与MSF1相比,它在Ringworm类别中的召回率提高了。总体而言,MSF2模型实现了97.00%的更高准确率,表明其在不同类别中的优越性能,尽管在某些类别如Athlete-foot和Larva-migrans中还有改进空间。

MSF3模型在Athlete-foot、Nail-fungus、Chickenpox和Shingles类别中实现了完美的召回率,表明其在正确识别这些类别中的能力。然而,它在Ringworm类别中面临挑战,导致召回率较低。与MSF1和MSF2相比,它在Athlete-foot类别中有所改进,并在Nail-fungus类别中保持了良好的性能。Chickenpox表现优于MSF2,但与MSF1相似,而Shingles在MSF1中有所改进,同时保持与MSF2相似的性能。然而,其他类别的性能有所下降。MSF3的总体准确率为95.71%,低于MSF1(96.57%)和MSF2(97.00%),表明其在某些类别中还有改进的潜力。

最终,所提出的SGO-DRE集成方法展示了出色的性能,大部分类别(Impetigo、Athlete-foot、Nail-fungus、Chickenpox和Shingles)实现了完美的召回率,表明其在正确区分这些类别中的卓越能力。模型在Cellulitis和Larva-migrans类别中也表现出良好的性能,召回率分别为0.9706和0.9600。尽管在Ringworm类别中召回率略低,但整体表现依然出色。与MSF1、MSF2和MSF3这三种基线模型相比,所提出的SGO-DRE集成方法在召回率和准确率上均表现出色,实现了98.71%的最高总体准确率,表明其在所有类别中的卓越分类能力。此外,所提出的SGO-DRE集成方法展示了更高的特异性,表明其在区分皮肤疾病中的优势。

在模型性能的进一步评估中,我们使用了接收者操作特征-曲线下面积(ROC-AUC)和精确率-召回率(P-R)曲线,如图9所示。ROC-AUC曲线对于评估模型区分正负类的能力至关重要,通过提供模型性能在所有分类阈值下的综合度量。P-R曲线对于在不平衡数据集中评估模型的精确率和召回率之间的权衡尤为重要,揭示了模型在平衡假阳性和真阳性方面的能力。ROC-AUC曲线显示,所有模型都表现出强劲的AUC值,其中MSF1模型的AUC为0.9982,MSF2为0.9992,MSF3为0.9980,而所提出的SGO-DRE集成方法达到0.9995,表明其在区分正负样本中的总体优秀性能。在P-R曲线分析中,所提出的SGO-DRE集成方法表现优于其他方法,平均精确率(AP)为0.9970。MSF2紧随其后,AP为0.9951,而MSF1和MSF3的精确率略低,分别为0.9913和0.9885。这些结果表明,所提出的SGO-DRE集成方法在精确率和召回率之间保持了更优的平衡,尤其是在高阈值下,表明其在分类能力上的总体增强。

在所提出方法与现有CNN的比较分析中,我们展示了所提出方法在各个类别中的表现。表4提供了所提出方法与个体基线模型的性能比较。DenseNet121-Base模型的召回率最低,为90.89,导致准确率最低,为91.42%。InceptionResNetV2-Base模型的召回率也为91.81,准确率为92.27%。在DenseNet系列中,DenseNet201表现出色,召回率为96.51,准确率为96.57%。MobileNetV1表现出色,召回率为96.02,准确率为96.14%,尽管其性能仍落后于DenseNet201。相比之下,DenseNet169模型的性能低于DenseNet201和MobileNetV1,但高于其他模型。所提出的方法显著优于所有个体模型,实现了98.71%的高准确率和98.59%的召回率,表明其在个体模型中的卓越表现。

在消融研究部分,我们展示了所提出集成方法与其他传统集成方法的性能比较。表5显示,产品集成和最小集成分别达到了97.42%的准确率,而最大集成和加权平均集成的准确率略有提高,为97.85%。几何平均集成的准确率也为97.42%。基于粒子群优化(PSO)的集成方法和基于灰狼优化(GWO)的集成方法分别达到了98.28%的准确率,显示出卓越的性能。然而,这两种方法仍落后于所提出的基于SGO的集成方法,后者在总体分类准确率上表现出色,达到了98.71%。表6总结了SGO与其他生物启发式算法的比较。SGO在集成优化中的效率高,而在探索和利用之间的平衡上表现良好,具有高度的适应性,适用于复杂和动态任务。相比之下,其他算法如遗传算法(GA)、PSO和GWO在某些方面存在不足,如在复杂集成任务中的效率和适应性。

在所提出模型与现有研究的性能比较中,我们展示了所提出方法在多个数据集上的表现。表7提供了所提出方法与其他方法的准确率比较。所提出的SGO-DRE集成方法实现了98.71%的高准确率,优于所有比较方法,包括堆叠集成的98.20%、带有注意力的CNN的96.41%和基于模糊排序的深度集成的95.14%。使用视觉变换器与CNN融合的方法准确率稍低,为93.19%。带有Spike注意力块(SAB)的CNN表现出合理的准确率,为97.00%。GTO算法与Faster R-CNN方法实现了竞争性的准确率,为98.55%,但仍低于所提出方法。这些实证结果突显了所提出方法在高效捕捉和利用皮肤图像中重要特征方面的有效性,从而提高诊断准确率。

在Grad-CAM可视化分析部分,我们展示了Grad-CAM在多种皮肤疾病图像上的应用,如图10所示。最后一行展示了来自不同皮肤疾病类别的随机输入图像,显示了模型在分类决策时关注的区域。Grad-CAM提供了有价值的信息,揭示了模型在分类过程中识别的关键区域。这些可视化有助于揭示图像中对分类决策有贡献的具体区域,为临床设置提供透明度和可解释性。在所提出的SGO-DRE集成方法中,热图始终显示皮肤疾病区域,这与预期结果一致。所关注区域的一致性受到关键贡献因素的影响,这对理解模型如何做出预测至关重要。在临床环境中,Grad-CAM可以用来提高可解释性,使皮肤科医生能够看到模型在图像中关注的区域。

在McNemar统计检验部分,我们使用McNemar检验来评估所提出方法与配对模型在相同数据集上的性能差异。表8展示了McNemar检验的结果,比较了所提出的SGO-DRE集成方法与MSF1、MSF2和MSF3模型。所有配对比较都显示出统计显著性差异(p < 0.05),p值分别为2.51e-03、0.0165和1.41e-04。这些结果表明,所提出的SGO-DRE集成方法的性能改进具有统计显著性,不太可能是由随机变化引起的。

在附加测试部分,我们进一步评估了所提出方法的性能,使用了一个包含6类的MSLD皮肤疾病数据集。表9提供了基线模型和所提出方法在附加数据集上的类别性能比较。MSF1模型在Normal和Monkeypox类别中表现出色,准确率分别为98.28%和96.43%。然而,在Chickenpox和Measles类别中,MSF1面临显著的分类挑战,召回率分别为66.67%和77.79%。相比之下,所提出的SGO-DRE集成方法在Normal类别中实现了完美的召回率,而在Monkeypox类别中达到了98.21%的召回率。尽管在Chickenpox类别中召回率较低,所提出方法在所有类别中仍实现了93.46%的总体准确率,这表明其在多个皮肤疾病类别中的卓越分类能力。在特异性方面,所提出的方法也超过了其他基线模型。

在模型的鲁棒性验证部分,我们评估了所提出方法在未见过的数据集上的表现。表10展示了在附加的4类皮肤疾病数据集上,基线模型和所提出方法的类别性能比较。MSF1模型在Normal类别中表现优异,召回率为98.28%。MSF2模型在Normal类别中也表现出色,召回率为98.28%。MSF3模型在Normal类别中表现稳健,召回率为96.55%。相比之下,所提出的SGO-DRE集成方法在Normal类别中实现了完美的召回率,而在Monkeypox类别中达到了98.21%的召回率。尽管在Chickenpox类别中召回率较低,所提出方法在所有类别中仍实现了93.46%的总体准确率,这表明其在多个皮肤疾病类别中的卓越分类能力。在特异性方面,所提出的方法也超过了其他基线模型。

在局限性和优势部分,我们讨论了所提出方法的局限性。引入降维块会增加一些计算成本,但整体模型大小仍小于基于变换器的模型和其他深度架构。降维减少了特征空间,从而加快计算速度,提高内存使用效率,增强模型的效率和性能。在未来的研究所,我们计划进一步优化该块,以在效率和性能之间取得更好的平衡。模型的有效性显著受到训练数据集质量和多样性的影响。当数据集不多样或存在偏差时,模型可能在新数据上泛化能力较差。数据增强已被用于增加数据集的多样性,缓解这一问题,但单独使用数据增强不足以完全解决这一问题。未来研究中,将采用更先进的技术,如焦点损失或采样策略,以更有效地解决不平衡问题,提高模型在所有类别中的性能和泛化能力。

在优势部分,所提出方法使用了鱿鱼游戏优化算法,使得集成模型中的权重分配达到最优,有效利用了每个模型的优势。这导致了更可靠和精确的分类性能。在每个深度学习模型中使用降维块可以减少数据复杂性,加快训练和推理速度,并防止过拟合,从而提高模型在未见过数据上的泛化能力。

在结论部分,我们总结了本研究的成果。本研究开发了SGO-DRE方法,以解决传统皮肤疾病诊断方法的局限性,这些方法往往耗时且容易出错。通过利用预训练模型MobileNetV1、DenseNet201和Xception进行稳健的特征提取,我们通过引入降维块提高了其性能。该方法确保了高效特征处理的同时保持了准确性。此外,通过使用鱿鱼游戏优化算法,我们有效地解决了模型集成问题,优化了集成模型中各个模型的权重。我们的方法在三个不同的皮肤疾病数据集上进行了评估,分别是8类皮肤疾病数据集、6类MSLD数据集和4类MSID数据集。结果展示了所提出方法的有效性,分别取得了98.71%、96.34%和93.46%的准确率。此外,通过Grad-CAM和ROC、精确率-召回率曲线等可视化分析,提供了模型行为和性能的宝贵见解,进一步验证了SGO-DRE集成方法的鲁棒性和可解释性。总体而言,本研究成功突显了SGO-DRE方法在提高皮肤疾病诊断准确性和效率方面的潜力。该方法不仅优于现有模型,还提供了一种透明且可解释的解决方案,可以在临床环境中获得信任。

在数据和材料的可用性部分,我们指出当前研究中生成或分析的数据集可以从Kaggle目录中获取:https://www.kaggle.com/datasets/subirbiswas19/skin-disease-dataset/data(访问日期:2025年8月10日)。

在伦理批准部分,我们指出本研究不涉及伦理问题。

在利益冲突部分,我们声明本研究中没有需要报告的利益冲突。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号