基于开放词汇检测与ViT骨干网络的高效可扩展花粉自动监测训练集生成方法
《Scientific Reports》:Efficient and scalable training set generation for automated pollen monitoring with Hirst-type samplers
【字体:
大
中
小
】
时间:2025年12月18日
来源:Scientific Reports 3.9
编辑推荐:
为解决花粉监测中人工标注成本高昂、可扩展性差的问题,研究人员开展了一项关于自动化花粉检测训练集生成的研究。他们开发了一个结合OWL-ViT单次检测与系统化精炼的AI辅助流程,能够从纯种花粉玻片中高效生成数万条高质量标注。研究结果表明,该流程显著降低了人工标注负担,且基于LVD-ViT-L骨干网络的模型在外部数据集上表现出优异的分类性能,为大规模花粉监测提供了可行的技术框架。
在全球气候变化和过敏性疾病高发的背景下,准确、高效地监测空气中花粉的浓度和种类,对于公共卫生预警、生态研究和过敏原管理至关重要。目前,全球范围内广泛使用的Hirst型花粉采样器虽然成本低廉、技术成熟,但其后续分析却高度依赖人工镜检。专家们需要在高倍显微镜下逐一识别和计数花粉颗粒,这个过程不仅耗时费力,而且存在主观性,严重制约了花粉监测的规模化和实时性。尽管深度学习技术为自动化分析带来了希望,但训练高性能模型所需的海量、高质量标注数据,其获取成本同样高昂,成为了阻碍技术落地的关键瓶颈。
为了突破这一瓶颈,来自匈牙利、瑞典和法国的研究团队在《Scientific Reports》上发表了一项研究,他们开发了一个高度自动化的训练数据集生成流程,旨在将花粉监测从繁重的人工劳动中解放出来。该研究通过结合开放词汇目标检测与系统化精炼技术,能够以极低的人工干预成本,从纯种花粉玻片中高效生成数万条高质量标注,为构建可扩展的AI辅助花粉监测系统奠定了坚实基础。
为了开展这项研究,研究人员主要运用了以下几项关键技术方法:首先,他们构建了多区域数据集,包括来自匈牙利、瑞典和法国的纯种花粉玻片以及真实空气样本;其次,开发了基于OWL-ViT的单次检测与YOLOS-Tiny精炼的自动化标注流程;再次,利用线性探测评估了多种预训练骨干网络(如LVD-ViT、UNI-ViT和ResNet50)的特征提取能力;最后,将选定的骨干网络集成到Faster R-CNN框架中,训练并评估了花粉目标检测模型的性能。
研究人员首先评估了自动化标注流程的质量。该流程利用OWL-ViT进行单次检测,随后通过统计过滤和YOLOS-Tiny精炼,能够高效生成经过筛选的训练数据集。结果显示,经过精炼后,所有数据集和图像块尺寸下的平均精度(AP)和平均召回率(AR)均得到了一致提升。例如,在匈牙利数据集上,518像素图像块的AP50从初始的0.552提升至精炼后的0.829。这表明该流程能够有效去除噪声并恢复有效实例,从而生成高质量的训练数据。
为了评估不同骨干网络的特征提取能力,研究人员进行了线性探测分析。结果显示,在外部测试数据集上,LVD-ViT-L骨干网络始终表现出最优的分类性能。在匈牙利数据集上,其宏平均精确率、召回率和F1分数分别达到0.937±0.001、0.872±0.005和0.890±0.004。相比之下,ResNet50模型表现不佳,凸显了卷积架构在花粉分类中的局限性,以及ViT骨干网络在提取细粒度花粉特征方面的优势。
研究人员将选定的骨干网络集成到Faster R-CNN框架中,并评估了其完整的目标检测性能。在匈牙利数据集上,基于LVD-ViT-S的模型在外部测试中取得了最高的AP(0.50:0.95)(0.576±0.011),优于基于ResNet50的模型。然而,在瑞典数据集上,基于ResNet50的模型表现更佳,这表明在形态多样的数据集上,模型对域偏移的敏感性更高。此外,在病理学数据上预训练的UNI-ViT-L模型在所有设置下均表现不佳,表明预训练域与花粉形态之间存在不匹配。
为了评估模型在实际部署环境下的性能,研究人员在匈牙利采集的真实空气样本上测试了所有检测器。结果显示,基于COCO预训练ResNet50(CO-RN50)骨干网络的Faster R-CNN模型在此环境下表现出最高的鲁棒性,AP(0.50:0.95)达到0.559±0.075。这表明该模型在真实世界的复杂环境中具有良好的泛化能力。
该研究成功开发并验证了一个高效、可扩展的自动化花粉检测训练集生成流程。通过结合OWL-ViT的单次检测能力和系统化精炼策略,该流程能够以极低的人工成本生成大规模、高质量的训练数据。研究结果表明,预训练的Vision Transformer骨干网络在花粉特征提取方面表现出色,为构建高性能的自动化花粉监测模型提供了强大的基础。尽管交叉区域泛化仍面临挑战,但该研究为花粉监测的自动化和规模化提供了切实可行的技术路径,有望在公共卫生、生态研究和过敏原管理等领域发挥重要作用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号