
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于深度学习的可可花访客识别数据集:推动可持续可可生产的智能监测新方法
【字体: 大 中 小 】 时间:2025年07月29日 来源:Scientific Data 5.8
编辑推荐:
本研究针对可可授粉研究不足的问题,开发了首个可可花访客深度学习数据集(含5,792张昆虫图像),采用YOLOv8模型实现高效识别(F1 Score 0.71)。该成果为热带农业生态系统服务评估提供了创新技术方案,对优化全球巧克力产业链的可持续发展具有重要意义。
巧克力作为全球价值数十亿美元的产业,其原料可可的产量却长期受限于授粉不足问题。令人惊讶的是,人工授粉可使可可产量提升200-800%,但自然传粉者的种类、行为及其对产量的影响仍是未解之谜。传统监测方法如粘虫板和目视调查存在明显缺陷:它们无法建立访花昆虫与果实形成的直接关联,且可可花仅16%的成功授粉率使得观测极为困难。这一知识空白严重阻碍了通过生态手段提升可可产量的可能性。
针对这一挑战,浙江大学环境与资源学院联合西湖大学可持续农业系统与工程实验室的研究团队,在《Scientific Data》发表了开创性研究。团队利用嵌入式摄像头网络,历时两年在中国海南兴隆热带植物园采集2300万张图像,构建了全球首个专业可可花访客数据集(含5类昆虫),并开发了基于YOLOv8的智能识别系统。这项工作为理解传粉者-作物互作机制提供了革命性工具,对实现联合国《2030年生物多样性框架》中的农业可持续发展目标具有重要实践价值。
研究采用三项关键技术:1)基于运动检测的嵌入式摄像头系统(分辨率1,944×1,944像素)实现24小时不间断监测;2)渐进式训练策略(先以256张图像建立基础模型,逐步扩展至5,792张标注图像);3)多尺度YOLOv8架构比较(从YOLOv8n到YOLOv8l)结合背景图像比例优化(测试0%-15%比例)。
数据收集与模型训练
通过"帧差分+斑点检测"算法从海量图像中筛选有效数据,采用半自动标注流程(先模型预标注再人工校验)确保6,027个边界框的准确性。训练过程中创新性应用HSV变换、图像平移和马赛克增强等5倍数据扩增技术,显著提升模型在低对比度场景下的鲁棒性。
模型性能验证
中型YOLOv8m(2580万参数)在8%背景图像比例时表现最优:整体F1 Score达0.71,mAP50为0.70,且将误报率控制在2.6%。值得注意的是,寄生蜂(Encyrtidae)识别效果最佳(mAP50 0.89),而数量最多的蠓科(Ceratopogonidae)因图像模糊问题识别难度最大。
背景图像的影响
研究发现背景图像比例存在"黄金区间"——8%比例既能将误报率降至0.026,又保持较高召回率(0.65)。超过15%比例会导致模型性能显著下降,揭示出农业场景下背景噪声处理的特殊性。
这项研究建立了可可授粉研究的标准化数据基准,其方法论对其它低对比度农业场景(如温室授粉监测)具有重要借鉴意义。特别是提出的"背景图像比例优化"策略,为野外复杂环境中的小目标检测提供了新思路。随着气候变化加剧热带作物生产压力,该技术可扩展应用于咖啡、香草等经济作物的精准农业管理。未来研究需增加地理多样性样本,并探索访虫频率与坐果率的定量关系,最终实现从生态监测到产量预测的全链条解决方案。
生物通微信公众号
知名企业招聘