一种优化的迁移学习方法,结合深度卷积特征提取器用于红细胞显微镜下疟原虫的分类

《Frontiers in Medicine》:An optimized transfer learning approach integrating deep convolutional feature extractors for malaria parasite classification in erythrocyte microscopy

【字体: 时间:2025年11月08日 来源:Frontiers in Medicine 3.0

编辑推荐:

  疟疾由疟原虫引起,传统显微镜诊断效率低且易出错。本文提出一种集成学习框架,结合VGG16、VGG19、DenseNet201和自定义CNN,通过自适应加权平均和硬投票机制提升诊断精度。实验表明,该模型在NIH数据集上达到97.93%测试准确率,优于单一模型,并显著减少假阴性率。方法包括数据预处理(归一化、去噪)、数据增强(旋转、翻转等)、迁移学习和动态权重分配。研究强调多模型融合能有效克服单一模型过拟合,提升资源受限环境下的诊断可靠性。

  疟疾是由疟原虫引起的一种严重疾病,主要通过受感染的雌性按蚊的叮咬传播。这种疾病对全球公共卫生构成了重大挑战,尤其是在资源有限的地区,如撒哈拉以南非洲,占据了全球病例和死亡的绝大多数。尽管多年来全球范围内采取了多种控制措施,但疟疾依然造成了巨大的健康负担。根据世界卫生组织的数据,2022年全球记录了约2.29亿例疟疾感染和40.9万例死亡,而在2023年,这一数字略有下降,但仍高达214万例感染和24万例死亡。这些数据凸显了开发高效、可扩展的诊断技术的紧迫性,以提高疟疾检测的准确性和速度,从而为患者提供及时治疗。

为了应对这些挑战,本研究提出了一种基于集成学习的深度学习框架,用于自动疟疾诊断。该方法整合了多种预训练模型,包括VGG16、ResNet50V2、DenseNet201和VGG19,通过结合它们的输出来提高诊断的准确性和鲁棒性。此外,研究还引入了一种自定义的卷积神经网络(CNN)架构,并通过数据增强和预处理技术来提升模型的性能。与传统的单模型方法相比,集成学习通过结合多个模型的预测结果,有效降低了单个模型的偏差,同时提高了整体的诊断能力。

研究中使用了美国国家卫生研究院(NIH)提供的21,322张显微镜下红细胞图像,其中13,779张为感染图像,7,543张为未感染图像。这些图像在训练和测试阶段被分为80%和20%,以确保模型能够适应多样化的数据。然而,该数据集存在一定的标签错误,影响了约5%的样本,这通过领域专家的审查和修正得以解决。通过数据增强,如随机旋转、翻转、缩放等,模型在面对不同质量的图像时也能保持较高的泛化能力。

在模型构建过程中,采用了多种技术,包括归一化、噪声减少和类别平衡。归一化将图像像素值从0到255调整为0到1,确保输入的一致性。噪声减少通过高斯滤波和中值滤波,有效降低了图像中的干扰,同时保留了关键的细胞结构。类别平衡则通过数据增强和专家验证,解决了数据集中的类别不平衡问题,确保模型在不同类别之间表现均衡。

研究还引入了自适应加权平均和硬投票的集成方法。自适应加权平均根据模型在验证集上的表现动态分配权重,使得性能更好的模型在最终预测中具有更大的影响力。硬投票则通过多数投票机制,确保模型预测的一致性。这种双重集成策略在实际应用中表现出更高的准确性和鲁棒性,优于传统的固定权重平均方法。

在实验结果方面,集成模型在测试集上达到了97.93%的准确率,F1分数和精确度均为0.9793,显著优于单独模型如自定义CNN(97.20%)、VGG16(97.65%)和CNN-SVM(82.47%)。这些结果表明,集成学习方法在疟疾诊断任务中具有显著的优势,能够更可靠地识别受感染和未受感染的血涂片。

此外,研究还评估了不同优化器和学习率对模型性能的影响,结果显示使用自定义CNN和机器学习分类器(如支持向量机SVM)的组合能够达到81.67%的测试准确率。而通过数据增强和模型微调,VGG19在测试集上的表现最佳,达到了97.65%的准确率。集成方法的引入进一步提升了模型的性能,通过自适应加权平均和硬投票,最终达到了97.93%的测试准确率。

本研究还探讨了模型在实际医疗环境中的应用潜力。通过系统化的诊断流程,包括图像预处理、分割、特征选择和分类,确保了模型的全面性和可扩展性。此外,模型的轻量级设计使其适用于移动设备,从而在偏远和资源匮乏地区提高疟疾诊断的可及性。研究还指出,通过改进预处理流程、使用更多样化的数据集以及探索移动应用,可以进一步提升模型的泛化能力和临床适用性。

尽管本研究取得了显著成果,但仍然存在一些局限性,如数据集的局限性和图像质量的波动。这些因素可能影响模型在不同环境下的表现。因此,未来的研究应关注更广泛的数据集和更复杂的预处理方法,以提高模型的适应性和准确性。通过这些改进,集成学习方法有望成为疟疾诊断的重要工具,为全球疟疾控制和消除提供有力支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号