使用二元红鹿算法(Binary Red Deer Algorithm)和ResNet框架对宫颈癌细胞进行分类的比较分析
《Biomedical Signal Processing and Control》:Comparative analysis for classification of cervical cancer cells using binary red deer algorithm and ResNet framework
【字体:
大
中
小
】
时间:2025年11月20日
来源:Biomedical Signal Processing and Control 4.9
编辑推荐:
宫颈癌检测中,比较了特征工程优化随机森林与调参ResNet-50模型,前者通过Binary Red Deer算法优化达到96.22%准确率,后者利用迁移学习在SiPaKMed数据集上实现98.45%准确率,ResNet-50在2/3/5分类中均表现最佳,结合Grad-CAM可视化提升诊断可解释性。
宫颈癌是一种全球范围内对女性健康构成重大威胁的疾病。根据世界卫生组织的数据,2018年全球约有341,831例宫颈癌死亡病例,而2020年则诊断出约604,000例。这种疾病主要由人乳头瘤病毒(HPV)感染引起,如果能在早期阶段被检测和治疗,其治愈率较高。然而,由于宫颈癌细胞在发展过程中具有缓慢性,其在癌前阶段的诊断仍然是一项挑战。及时准确的诊断不仅能显著改善患者的治疗效果,还能有效降低死亡率。
在传统的诊断方法中,巴氏涂片检查是一种常用手段,但这种方法依赖于人工评估,容易受到主观判断的影响,且过程繁琐。随着人工智能和深度学习技术的迅速发展,图像识别和分类的自动化成为可能,这为宫颈癌的早期检测提供了新的思路。深度学习技术在医学图像分析中表现出色,尤其是在癌症细胞的检测与分类方面。然而,这些技术仍然面临诸多挑战,例如特征提取的依赖性问题、数据获取的困难,以及细胞形态、大小和外观的多样性。
为了应对数据不足的问题,本研究重点探讨了数据增强技术的应用。数据增强是一种通过变换原始图像来增加训练样本数量的方法,有助于提高模型的泛化能力和准确性。在本研究中,采用了两种不同的方法进行宫颈癌分类。第一种方法基于领域特定的特征提取,结合了三种描述符:Haralick、HOG和Zernike矩,与四种机器学习分类器(K近邻、支持向量机、随机森林和逻辑回归)进行比较。实验结果显示,随机森林分类器在这些方法中表现最佳。为了进一步优化模型性能,研究还引入了二进制红鹿优化算法,该算法是一种元启发式优化方法,能够有效地调整分类器的参数,提高分类准确率。
第二种方法则采用了经过调参的ResNet-50模型。ResNet-50是一种广泛使用的预训练卷积神经网络,其结构设计有效缓解了梯度消失的问题,提高了深度模型的训练效率。在本研究中,通过调整ResNet-50的超参数,进一步提升了其在宫颈癌分类任务中的表现。实验在基准数据集SiPaKMed上进行,该数据集包含了大量宫颈癌细胞的图像数据,涵盖了多种细胞类型,为模型训练和评估提供了丰富的样本。结果表明,经过超参数调优的ResNet-50模型在分类性能上优于优化后的随机森林方法,取得了更高的AUC(曲线下面积)和准确率。具体而言,ResNet-50模型的AUC达到了97.62%,准确率高达98.45%,这表明该模型在识别宫颈癌细胞方面具有更强的判别能力。
研究中还探讨了数据预处理和特征提取的关键步骤。首先,对原始图像进行了标准化处理,包括调整图像尺寸至300x300像素,以确保模型输入的一致性。其次,使用自适应双边滤波器来增强图像的清晰度,减少噪声干扰,提高特征提取的准确性。此外,本研究还结合了多种特征提取技术,如HOG(方向梯度直方图)、Haralick纹理特征和Zernike矩,这些方法能够从图像中提取出丰富的形状、纹理和结构信息,为分类任务提供多维度的输入特征。
在分类性能的评估方面,研究采用了多种评价指标,包括准确率、AUC和F1分数。准确率衡量模型在所有样本中的正确分类比例,而AUC则反映了模型在不同分类阈值下的整体表现。F1分数则是精确率和召回率的调和平均,适用于类别不平衡的数据集。实验结果表明,两种方法在不同分类任务中均表现出较高的性能,但经过调参的ResNet-50模型在所有评估指标上均优于随机森林方法。这表明深度学习方法在处理复杂图像数据时具有更强的适应性和分类能力。
为了进一步提升模型的可解释性,本研究还引入了Grad-CAM(梯度加权类激活映射)技术。Grad-CAM是一种用于解释深度学习模型决策过程的可视化方法,能够突出显示图像中对分类结果起关键作用的区域。通过将Grad-CAM热图叠加在原始细胞图像上,研究人员能够直观地观察模型在识别不同细胞类型时的关注点。结果显示,Parabasal(基底细胞)、Metaplastic(转化细胞)和Dyskeratotic(角化不良细胞)在模型中表现出强烈的核激活,这表明这些细胞类型在分类过程中具有较高的置信度。相比之下,Superficial-Intermediate(表层-中间细胞)的激活模式更为分散,说明模型在这些细胞类型上需要考虑更多的特征信息。
本研究的创新点在于,通过结合传统机器学习方法与深度学习技术,探索了多种特征提取和模型优化策略,以提升宫颈癌分类的准确性和效率。首先,采用HOG、Haralick和Zernike矩等特征提取方法,能够从图像中获取更全面的细胞信息,为分类任务提供更丰富的输入特征。其次,通过将随机森林与二进制红鹿优化算法相结合,有效优化了分类器的参数,提高了模型的泛化能力。第三,利用预训练的ResNet-50模型,并对其进行超参数调优,进一步提升了分类性能。第四,通过对比两种方法的分类效果,验证了深度学习方法在处理复杂医学图像数据方面的优势。第五,引入Grad-CAM技术,不仅提高了模型的可解释性,还增强了医生和研究人员对模型决策的信任度。
此外,本研究还强调了数据质量和预处理策略对模型性能的重要影响。高质量的数据集是构建高效分类模型的基础,而合理的预处理方法能够有效提升图像的清晰度和特征的可提取性。在实验过程中,研究人员对数据集进行了严格的清洗和标准化处理,确保了模型训练的稳定性和准确性。同时,通过数据增强技术,增加了训练样本的多样性,避免了模型在训练过程中对特定特征的过度依赖,从而提高了其在实际应用中的适应性。
在实际应用中,深度学习模型的部署需要考虑计算资源和实时性要求。虽然ResNet-50模型在分类性能上表现出色,但其计算复杂度较高,可能在资源受限的环境中面临挑战。相比之下,优化后的随机森林方法在计算效率上具有优势,适合在边缘设备或资源有限的医疗环境中应用。因此,本研究不仅提供了高精度的分类方法,还考虑了实际应用中的可行性,为不同场景下的宫颈癌检测提供了多样化的解决方案。
通过本研究的探索,研究人员发现,尽管深度学习模型在分类任务中表现出色,但传统机器学习方法在某些情况下仍然具有竞争力。例如,在数据量较小的情况下,随机森林方法可能更容易达到较高的分类准确率,而深度学习模型则需要更多的训练数据来发挥其优势。因此,本研究的结论表明,未来的研究可以进一步探索传统方法与深度学习技术的结合,以充分发挥两者的优势,提高宫颈癌分类的准确性和效率。
综上所述,本研究通过对比两种分类方法,验证了深度学习技术在宫颈癌检测中的强大潜力。同时,研究也指出了传统方法在特定条件下的适用性。通过数据增强、特征提取优化和模型调参,研究人员成功提升了宫颈癌分类的性能,并通过Grad-CAM技术增强了模型的可解释性。这些成果不仅为宫颈癌的早期检测提供了新的技术手段,也为医学图像分析领域的进一步研究奠定了基础。未来,随着计算能力的提升和数据集的扩展,深度学习方法在宫颈癌检测中的应用将更加广泛,有望成为一种更加高效和准确的诊断工具。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号