通过基于深度学习的YOLOv3平台,快速准确地识别恶性疟原虫(Plasmodium falciparum)的红细胞内阶段寄生虫

《Frontiers in Microbiology》:Rapid and accurate recognition of erythrocytic stage parasites of Plasmodium falciparum via a deep learning-based YOLOv3 platform

【字体: 时间:2025年10月31日 来源:Frontiers in Microbiology 4.5

编辑推荐:

  疟疾诊断AI工具开发与评估:基于YOLOv3算法,通过采集疟疾患者薄血片样本,经图像预处理(滑动窗口裁剪及调整尺寸)和模型训练,在测试集上达到94.41%的总体识别准确率,假阴性率1.68%,假阳性率3.91%。工具适用于资源有限地区的疟原虫检测,显著提升工作效率并降低人工误差。

  疟疾是一种对全球公共卫生构成重大威胁的传染病,其主要致病阶段是恶性疟原虫(*Plasmodium falciparum*)在红细胞内的寄生过程。由于早期诊断对于有效治疗至关重要,因此本研究致力于开发并评估一种基于人工智能辅助诊断的工具,以提高疟疾寄生虫的识别效率和准确性。随着技术的发展,人工智能在医疗领域的应用日益广泛,特别是在图像识别方面,如用于新冠的CT图像分析、显微镜载玻片的自动诊断等。本研究将深度学习技术应用于疟疾诊断,探索其在临床薄血片检测中的潜力。

### 疟疾诊断的重要性与挑战

疟疾仍然是全球三大公共卫生疾病之一,与艾滋病和结核病并列。它由五种主要的疟原虫引起,其中恶性疟原虫是导致大多数死亡和严重病例的元凶。疟原虫在人体内的生命周期包括红细胞外和红细胞内两个阶段,而红细胞内阶段是主要的致病阶段,包括环状体、滋养体、裂殖体和配子体。2021年,全球估计有2.47亿例疟疾感染,导致约61.9万人死亡。尽管显微镜检查被认为是疟疾诊断的“金标准”,因其高准确性和对疟原虫种类及生命周期的识别能力,但其操作繁琐且依赖于专业技术人员,这使得在资源有限的地区推广显微镜诊断变得困难。

为了应对这一挑战,研究者们正在探索人工智能在疟疾诊断中的应用。通过自动化和智能化手段,可以有效减少人工识别的负担,提高检测效率。本研究选择基于YOLOv3的深度学习模型,用于检测恶性疟原虫感染的红细胞(iRBCs),并结合图像处理技术,实现对疟疾寄生虫的高效识别。

### 方法与技术流程

研究团队从前往非洲和东南亚国家的移民工人中收集了恶性疟原虫感染的血液样本,并通过快速诊断试剂盒和qPCR进行初步确认。随后,制备了薄血片,并使用显微镜扫描保存图像。为了适应YOLOv3模型的输入要求,原始图像被裁剪为20个小图像(518×486像素),每个图像再通过调整大小和填充至416×416像素。这一过程旨在保留图像的细节,同时确保模型的输入一致性。

在标签制作方面,研究团队特别关注了疟疾寄生虫与其他细胞成分(如血小板)之间的区分。由于血小板和疟疾寄生虫在形态和大小上高度相似,因此需要对每个包含寄生虫的单个细胞进行标注,以提高模型的识别准确性。通过这种方式,研究团队建立了包含929张图像的数据库,并从中筛选出2613张高质量的训练和测试图像。

模型的训练采用了分层的策略,即先通过专家审核优化数据标签,再使用YOLOv3模型进行训练和测试。模型的训练过程中,采用了8:1:1的比例划分数据集,用于训练、验证和测试。训练时,采用了16的批次大小,以适应GPU的显存限制,并通过余弦下降策略调整学习率,以实现模型的稳定收敛。此外,模型训练最多进行300个周期,并在验证集连续50个周期无显著提升时停止训练。

在模型验证阶段,研究团队使用了262张经过优化的测试图像,最终获得了94.41%的总体识别准确率。其中,误检率为3.91%,漏检率为1.68%。这一结果表明,YOLOv3模型在识别恶性疟原虫方面具有较高的效率和准确性,尤其在处理复杂背景和干扰因素时表现良好。

### 模型的适应性与性能优化

为了进一步验证模型的适应性,研究团队在公开的BCCD(血液细胞计数与检测)数据集上进行了微调实验。在BCCD数据集上,YOLOv3模型达到了96.7%的mAP(平均精度)、100%的精度、96%的召回率和94%的F1值。这些指标反映了模型在标准化、低方差条件下具备强大的检测能力。

然而,需要注意的是,BCCD数据集的背景较为均匀,且图像获取条件相对稳定,与实际临床环境存在差异。相比之下,临床薄血片图像包含了更多现实世界中的干扰因素,如白细胞、血小板、染色伪影和细胞碎片等,这使得检测任务更加复杂。因此,本研究在临床薄血片数据集上获得的94.41%总体准确率虽然略低于BCCD数据集的性能,但在面对真实世界环境时,仍表现出较高的鲁棒性和实用性。

此外,研究团队还对YOLOv8和YOLOv11等新一代模型进行了对比实验。结果显示,YOLOv8和YOLOv11在相同数据集上的mAP@0.5分别为0.977和0.978,比YOLOv3的0.973略有提升。然而,YOLOv8和YOLOv11的召回率(0.918和0.912)略低于YOLOv3(0.943),表明新模型可能在保持高精度的同时,牺牲了部分寄生虫的识别率。这种性能上的权衡在实际应用中具有重要意义,特别是在资源有限的地区,高精度可能比高召回率更为关键。

### 与现有研究的比较

与其他基于薄血片检测的研究相比,本研究在模型优化方面更具创新性。例如,Yang等人(2020)在疟疾寄生虫检测中达到了93.46%的准确率,而Hung等人(2020)使用了计算成本较高的级联Faster R-CNN与AlexNet结合的方法,取得了98%的准确率,但其主要针对的是较大尺寸的疟疾寄生虫(如*P. vivax*)。相比之下,本研究更关注恶性疟原虫在薄血片中的检测,尤其是在复杂背景和低寄生虫密度的情况下。

此外,Muhammad等人(2025)在公开数据集上使用YOLOv8取得了80.3%的mAP,而Lufyagila等人(2025)则在临床图像上达到了86.2%的mAP。与这些研究相比,本研究在临床薄血片数据集上实现了94.41%的总体准确率,显示出在实际应用中的优势。

### 模型的创新与意义

本研究的创新之处在于,它不仅关注模型结构的优化,更强调对数据质量的深入理解和细致调整。研究团队在数据预处理阶段投入了大量精力,以解决临床数据中常见的标签不一致、漏标和误标问题。通过引入自适应数据增强和训练策略,他们提升了模型在复杂现实场景中的表现。

同时,研究团队还展示了模型在跨数据集验证中的良好表现。将模型应用于BCCD数据集时,其在未进行任何微调的情况下,仍能取得96.7%的mAP和94%的F1值。这一结果表明,模型不仅具备良好的泛化能力,还能够适应不同类型的血片图像。

此外,本研究还强调了模型在资源有限环境中的适用性。YOLOv3模型在保持高识别精度的同时,具有较高的计算效率,能够在实际医疗环境中快速部署。与传统的显微镜检查相比,该模型能够显著减少检测时间,提高工作效率,并降低对专业技术人员的依赖。

### 临床应用与未来方向

尽管本研究主要关注恶性疟原虫的二分类识别,但在未来的工作中,团队计划扩展模型以支持更多疟原虫种类的检测,并引入寄生虫阶段分类。这种阶段分类对于评估疾病严重程度和监测抗疟药物的疗效具有重要意义。例如,滋养体和裂殖体的比例与疾病严重程度密切相关,而配子体的检测则有助于评估疟疾的传播潜力。

为了实现这一目标,研究团队认为需要在训练数据集中加入更多样化的样本,并引入阶段特异性标注。此外,他们还计划在多中心研究中验证模型的鲁棒性,以确保其在不同临床环境中的适用性。只有在经过充分验证后,该模型才能被广泛应用于临床实践。

总的来说,本研究开发的基于YOLOv3的人工智能辅助诊断工具,在恶性疟原虫的识别和分类方面展现出良好的性能。它不仅能够提高检测效率,还能为资源有限地区的疟疾控制提供可行的技术支持。未来,随着人工智能技术的不断发展,特别是在YOLO系列模型的持续优化,疟疾诊断将更加智能化和自动化,从而更好地服务于全球公共卫生事业。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号