真菌感染智能诊断新突破:基于Capuchin搜索优化的空间金字塔ResNet-50(CapuSPP-ViTNet)模型实现99.71%高精度分类

《Biomedical Signal Processing and Control》:CapuSPP-ViTNet: Fungal infection detection via spatial Pyramid pooling and Nature-Inspired deep learning

【字体: 时间:2026年02月19日 来源:Biomedical Signal Processing and Control 4.9

编辑推荐:

  本文提出并验证了一种创新且高效的深度学习(DL)框架——CapuSPP-ViTNet,用于自动化检测和分类显微图像中的真菌感染。该模型集成了图像预处理(如CLAHE、高斯滤波)、精准分割(KFCM)、特征提取(GLCM)及分类模块,并创新性地结合了空间金字塔池化(SPP)进行多尺度特征捕获和卷尾猴搜索优化(CSO)算法进行超参数调优。实验结果表明,该方案在公开数据集上实现了优异的综合性能(准确率99.71%,F1分数99.79%),为临床真菌感染的早期、快速、自动化诊断提供了一个极具潜力的高效解决方案。

  
研究亮点与结论
研究亮点
尽管ResNet-50、SPP、ViT和CSO各自都是成熟技术,但本工作的新颖性在于首次将它们紧密功能集成到一个用于显微真菌图像分类的、联合优化的多尺度全局注意力框架中。与传统的独立运行SPP和ViT的融合方法不同,本模型引入了CSO驱动的优化-架构协同设计,其中CSO直接优化了SPP增强的特征金字塔和ViT注意力模块的超参数。
结果与讨论
本部分对提出的研究模型进行了评估,旨在借助所提模型预测多种真菌类别。同时,为了展示所提优化分类器的性能,还在没有SPP和优化模型的情况下进行了对比模型的测试。这些结果验证了所提模型的有效性,并且在本节末尾,也将所提方法与常规技术进行了比较和讨论。
对比分析表明,所提出的CapuSPP-ViTNet模型在所有宏观指标上均优于ResNet-50–ViT和ResNet-50–SPP–ViT模型。在分类一致性方面,它取得了最佳准确率(99.71%)、精确度(99.79%)和F1分数(99.79%)。此外,如表8所示,该模型识别真阳性和真阴性的特异性达99.92%,灵敏度达99.80%。Cohen‘s Kappa值为0.9957,进一步证实了该显微图像真菌预测系统的鲁棒性和可靠性。
关于生物启发式优化分类的讨论
生物启发式优化技术由于模仿自然搜索行为,在深度学习模型中用于自动超参数调优颇受欢迎。本工作通过将CSO与CapuSPP-ViTNet分类器集成,自适应地优化关键网络参数,消除了手动和网格搜索调优的局限。CSO表现出的强大全局探索能力和均衡的开采能力,使其能够有效避免陷入局部最优和早熟收敛,这是所提模型获得更高准确率的原因。
分割技术性能比较
不同分割技术对比评估的结果如表11所示。KFCM在与FCM和U-Net的对比中,展示了最佳性能。
预处理技术性能比较
从表12可以看出,所提出的CLAHE + 高斯滤波预处理方案获得了最高的PSNR、SSIM和对比度改善指数,证实了其相对于常规方法在真菌结构可见性方面有显著提升。
所提出的CapuSPP-ViTNet模型中整合SPP层的特别动机在于其处理多尺度空间变化和可变输入图像尺寸的能力,而无需在中间阶段进行固定尺寸的调整。与常规池化不同,SPP...
鲁棒性与分布外泛化分析
为了定量证明所提CapuSPP-ViTNet模型的鲁棒性,我们通过分布外(OOD)泛化准确率和基于雅可比范数的敏感性分析来评估其性能。OOD样本通过对原始测试图像施加可控扰动(包括高斯噪声、对比度缩放、模糊和轻微几何形变)来合成生成,这些扰动模拟了训练中未见的真实世界成像变异性。所提模型在OOD测试集上实现了...
基于雅可比范数的敏感性
进一步使用雅可比范数分析模型的鲁棒性,该范数衡量模型输出相对于小输入扰动的敏感性,定义如下:
‖J‖F= ‖?f(x)/?x‖F
其中 f(x) 是模型输出,x 是输入图像。较低的雅可比范数表明更高的局部稳定性和对对抗性或噪声驱动扰动的更强抵抗力。所提CSO优化模型的平均雅可比范数为1.87,显著低于基线模型(3.42)和...
CapuSPP-ViTNet的验证与最优性保证
CapuSPP-ViTNet模型的最优性通过验证驱动的超参数优化方案与CSO算法的结合来保证。训练期间,数据集被划分为训练集、验证集和测试集,其中CSO通过最小化验证集上的分类误差(而非仅训练集)来迭代更新超参数。这防止了有偏调优,并直接促进了面向泛化的最优性。在每次CSO迭代中...
临床部署与实际应用
除了学术基准测试,所提出的CapuSPP-ViTNet框架非常适合于真实世界的临床部署,特别是在专家真菌学家资源有限的低资源实验室环境和即时诊断场景中。轻量级预处理流水线与预训练深度架构的结合,使得模型能够以最小的计算开销进行快速推理,便于集成到桌面实验室系统、便携式数字...
在深度特征学习背景下使用GLCM的合理性
尽管现代深度神经网络能够直接从原始图像中学习分层的纹理表征,但本研究纳入基于GLCM的手工纹理特征,是考虑到真菌结构具有高度细粒化和重复性的微纹理模式,这些模式在荧光显微镜下通常很细微且对比度低。GLCM明确地捕获了二阶空间共生统计量(对比度、同质性、相关性和熵),这些统计量是...
全面的实验评估与临床可行性分析
实验评估通过明确定义训练-验证-测试策略(70%-15%-15%)并结合验证驱动的早停法得到了加强,所有结果均在完全未见过的测试集上报告以避免偏差。所提出的CapuSPP-ViTNet的计算复杂度和部署可行性也通过参数量、模型大小、训练时间和推理速度等指标进行了报告,并与轻量级深度模型进行了对比分析,这与...
统计有效性
为了确保报告性能的统计可靠性,所有实验在不同随机初始化下重复运行了五次,结果以平均值±标准差表示。此外,使用配对显著性检验(95%置信度下的配对t检验/Wilcoxon符号秩检验)将所提CapuSPP-ViTNet与基线模型进行统计比较。获得的p值(<0.05)证实了所提模型性能提升的...
局限性及未来工作
尽管所提CapuSPP-ViTNet模型在DeFungi基准数据集上展示了近乎完美的性能,但必须承认其存在一定的局限性。首先,尽管使用了验证驱动优化、早停法和正则化,高准确率水平仍带来了潜在的过拟合风险。其次,目前模型仅在一个公开数据集上进行了验证,尚未在独立的、多中心的临床数据集上进行外部验证,这可能...
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号