利用机器学习方法从CALIPSO卫星观测数据中反演行星边界层高度
《Ecological Informatics》:Retrieval of planetary boundary layer height from CALIPSO satellite observations using a machine learning approach
【字体:
大
中
小
】
时间:2025年10月09日
来源:Ecological Informatics 7.3
编辑推荐:
模型压缩技术优化YOLOv8n在移动设备上的蜱虫与蚊子实时检测应用。摘要:本研究通过量化与剪枝技术优化YOLOv8n模型,在保持高检测精度(mAP50达97.5%)前提下,显著降低移动设备能耗(能耗减少50%)和推理时间(缩短至原模型的32%-57%),提出混合剪枝策略以平衡模型大小与性能。测试三星Tab S7等三款手机显示量化技术最优,静态量化在单背景数据集上推理时间减少61%。
本研究探讨了在资源受限设备上部署机器学习模型的可行性,特别是在公民科学(citizen science)项目中用于病媒生物(如蜱虫和蚊子)的检测。随着机器学习技术的发展,特别是在图像识别领域,深度学习模型在病媒生物分类和检测中展现了强大的潜力。然而,这些模型通常占用大量存储空间并需要高性能计算资源,这在移动设备上存在部署挑战。本文通过比较模型压缩技术,包括剪枝(pruning)和量化(quantization),评估了它们在移动设备上的效率,旨在开发一种既能保持高精度又能适应移动设备资源限制的解决方案。
在公共卫生领域,病媒生物是多种传染病的传播媒介,如蜱虫传播的莱姆病和蚊子传播的疟疾、登革热、寨卡病毒等。这些疾病对全球数百万人的健康造成威胁,每年导致数以万计的死亡。传统的病媒生物监测依赖于专业昆虫学家对提交的图像或样本进行人工分类,这在面对大量数据时既耗时又耗费资源。随着公民科学的兴起,公众可以通过手机应用提交病媒生物的图像,从而扩大监测范围。然而,这种方法在实际应用中仍面临诸多挑战,如图像质量参差不齐、目标对象尺寸小、背景复杂等,这些都会影响模型的识别准确率。因此,研究如何在移动设备上高效部署病媒生物检测模型,具有重要的现实意义。
为了应对这些挑战,研究者们提出了多种模型压缩技术。其中,量化是一种广泛应用的方法,通过降低模型参数和计算的精度,减少模型的存储需求和计算成本。剪枝则是通过移除模型中不重要的参数或结构,从而减小模型体积并提高计算效率。这两种方法各有优劣,量化在计算效率方面表现突出,而剪枝在保持模型性能方面更具优势。因此,本文提出了一种结合量化和剪枝的混合策略,以平衡模型压缩与检测精度之间的关系。
本文的研究基于三个数据集:GBIF蜱虫数据集、GBIF蚊虫数据集和Roboflow蚊虫数据集。其中,GBIF数据集来源于全球生物多样性信息网络,包含了丰富的病媒生物图像数据。而Roboflow数据集则为单背景图像,便于模型训练和评估。研究团队利用YOLOv8n(You Only Look Once)模型进行实验,该模型因其轻量级和高效性被广泛应用于目标检测任务。在实验过程中,模型首先在这些数据集上进行训练,随后应用不同的压缩技术进行优化,包括结构化剪枝、非结构化剪枝、动态量化和静态量化,以及混合剪枝和量化策略。
研究发现,量化方法在效率方面优于剪枝方法。在不同数据集和设备上,静态量化能够显著减少推理时间,同时保持较高的检测精度。例如,在Roboflow蚊虫数据集上,静态量化使推理时间减少了57%(在三星Galaxy Tab S7上)和61%(在小米Redmi Note 10上),而仅损失了0.7%的mAP50(平均精度)。相比之下,动态量化虽然在保持精度方面表现较好,但推理时间的减少幅度较小,仅为27%。这表明,在简单背景下,静态量化是更优的选择,而在复杂检测任务中,动态量化仍然可以保持较好的性能。
剪枝方法虽然能够有效减小模型体积,但在移动设备上的应用存在一定的局限性。结构化剪枝能够移除整个通道或层,从而提高计算效率和能效,而非结构化剪枝则因稀疏计算的复杂性,难以在普通硬件上高效执行。研究团队通过结合结构化和非结构化剪枝,开发了一种混合策略,以弥补两种方法的不足。实验结果显示,混合剪枝方法在保持较高检测精度的同时,能够进一步减少模型体积。然而,混合剪枝在某些情况下会导致推理时间增加,这可能是因为不同层的剪枝比例不均衡,从而影响计算负载的分布。
在设备选择方面,研究团队选择了三种代表性的Android设备:三星Galaxy Tab S7(高端处理器)、小米Redmi Note 10(中端处理器)和三星Galaxy A53(中端处理器)。这些设备在市场占有率和硬件性能上具有代表性,能够反映不同计算能力下的模型表现。实验结果表明,静态量化在三星Galaxy Tab S7上实现了最短的推理时间和最低的内存占用,而在小米Redmi Note 10和三星Galaxy A53上,量化方法也表现出良好的性能。此外,结构化剪枝在某些情况下能够显著降低能耗,但会带来一定的精度损失。
研究团队还分析了模型压缩对推理时间和能耗的影响。通过对比不同压缩方法在不同设备上的表现,发现量化方法在降低能耗方面具有明显优势,特别是在需要长时间运行的场景中,如病媒生物监测。同时,剪枝方法在减少模型体积方面表现良好,但对推理时间的影响较为复杂。混合剪枝和量化策略在某些情况下能够实现更好的平衡,既保持了较高的检测精度,又有效降低了模型的资源需求。
总体而言,本研究为公民科学中的病媒生物检测提供了一种可行的模型部署方案。通过量化和剪枝的结合,研究团队展示了如何在移动设备上实现高效的病媒生物识别,从而推动实时监测和预警系统的建设。此外,研究还指出,未来的研究可以进一步探索更复杂的模型压缩策略,如混合精度量化和自适应量化,以更好地适应不同的应用场景。同时,开发用户友好的前端界面也是未来的重要方向,以帮助非技术人员更方便地使用这些技术,提高公民科学项目的可操作性和参与度。
本研究不仅对公共卫生和生态学领域具有重要意义,也为人工智能在资源受限环境中的应用提供了新的思路。通过优化模型,使其能够在移动设备上高效运行,研究团队为实现更广泛的病媒生物监测和数据收集奠定了基础。未来,随着技术的不断进步,这些方法有望被更广泛地应用于公共卫生监测、生态保护和疾病预防等领域,为全球健康和环境管理提供有力支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号