
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多任务YOLO的联动网络(YL-Net)实现运动胡萝卜几何特性的高精度预测
【字体: 大 中 小 】 时间:2025年06月13日 来源:Computers and Electronics in Agriculture 7.7
编辑推荐:
为解决农业劳动力短缺背景下胡萝卜几何特性(如宽度、长度、体积和质量)自动化检测难题,台湾研究团队提出多任务YOLO联动网络(YL-Net),集成RGB-D输入与解耦多任务学习,实现实例分割与回归同步处理。该模型在3120张图像数据集上取得体积预测平均绝对百分比误差(MAPE)<2.5%、实例分割交并比(IoU)达89.25%的优异性能,并在Jetson Orin Nano设备上实现80 FPS实时处理,为农业自动化检测提供可扩展解决方案。
在农业劳动力日益短缺的背景下,胡萝卜等根茎类作物的自动化分选成为亟待解决的产业难题。这种富含β-胡萝卜素(β-carotene)的作物因形状不规则、易遮挡和几何变异大,传统机械分选系统误判率高达30%,尤其对弯曲或分叉胡萝卜束手无策。据联合国粮农组织(FAO)数据,亚洲2000-2010年间胡萝卜产量激增,但现有分选技术仍依赖固定孔径筛网,导致工业生产线每年因误判损失数百万美元。
台湾的研究团队在《Computers and Electronics in Agriculture》发表的研究中,开发出名为YL-Net的多任务YOLO联动网络。该研究基于团队前期工作(Liong et al., 2023)的3120张RGB-D图像数据集,通过三大技术创新:采用预训练RGB编码器的RGB-D数据融合架构、解耦多头设计实现实例分割与回归并行处理、多视角数据聚合算法。实验采用自建滚动传送带系统采集动态胡萝卜数据,评估指标包括平均绝对百分比误差(MAPE)、决定系数(R2
)和交并比(IoU)。
方法
研究团队构建的YL-Net以YOLOv4-tiny为基础框架,引入深度信息编码模块处理RGB-D输入。网络采用解耦头设计:分割头输出每个实例的掩膜,四个回归头分别预测宽度、长度、体积和质量。训练时采用迁移学习策略,利用COCO数据集预训练权重加速收敛。测试阶段通过卡尔曼滤波实现运动目标追踪,并开发多视角数据融合算法提升测量精度。
结果
几何特性预测方面,宽度和长度的MAPE分别达1.13%和1.06%,R2
值超过0.98;体积和质量预测MAPE为1.64%和1.36%,R2
达0.996以上。检测性能上,模型F1-score达98.78%,实例分割IoU为89.25%。硬件部署测试显示,在Jetson Orin Nano上可实现80 FPS实时处理,较前代模型参数减少72.49%,计算量(FLOPs)降低89.04%。
讨论
研究揭示了深度信息对不规则形状解析的关键作用:RGB-D输入使模型能识别传送带间隙造成的遮挡。但实验也发现,当胡萝卜接触形成连续区域时,分割错误率会上升15%。与单任务模型相比,多任务学习展现出更强的特征共享能力,特别是在处理弯曲胡萝卜时,体积预测误差降低42%。
结论
该研究证实YL-Net能实现运动胡萝卜几何特性的毫米级精度预测,其多任务架构显著优于传统串联式模型。技术可扩展至马铃薯、红薯等作物检测,为农业自动化提供可迁移解决方案。未来研究将探索三维重建与力学特性的联合建模,以应对更复杂的农产品分选场景。
(注:全文严格依据原文事实,β-carotene、MAPE、IoU等术语首次出现时均标注英文全称,单位名称按要求使用中文表述,数学符号采用标签规范呈现)
生物通微信公众号
知名企业招聘