RowDetr:利用多项式进行端到端作物行检测

《Smart Agricultural Technology》:RowDetr: End-to-End Crop Row Detection Using Polynomials

【字体: 时间:2025年10月10日 来源:Smart Agricultural Technology 5.7

编辑推荐:

  作物行检测的端到端Transformer模型RowDetr通过多项式参数化和高效注意力机制,解决了GPS遮挡环境下的弯曲行检测难题,提出能量损失函数PolyOptLoss以优化几何对齐,在6962张高分辨率图像上达到F1分数0.74,延迟6.7ms,适合边缘设备部署。

  在现代农业的快速发展背景下,自主机器人和智能系统在农业作业中的应用日益广泛。尤其是在高通量表型分析领域,这些智能设备正发挥着越来越重要的作用。然而,由于农田环境的复杂性,特别是在GPS信号受到遮挡或无法获取的情况下,自主导航和作物行检测仍然是一个挑战。传统的GPS依赖型导航系统在密集的作物覆盖下容易受到信号干扰或丢失,导致定位不准确,这使得开发一种无需GPS的高效作物行检测方法成为迫切需求。

本文提出了一种名为RowDetr的高效端到端Transformer模型,专门用于在遮挡条件下检测作物行。RowDetr通过引入轻量级的主干网络和混合编码器结构,能够处理直线、曲线或被遮挡的作物行,从而在高精度农业中实现可靠的行识别。为了提高检测效率,RowDetr采用了多项式表示方式,将作物行直接参数化为多项式函数,避免了复杂的后处理步骤,从而减少了计算资源的消耗。这一设计不仅提高了检测的准确性,还增强了模型对标签噪声的鲁棒性,使其更适合部署在边缘计算设备上。

在方法论方面,RowDetr的架构主要由几个关键模块组成:主干网络、混合编码器、多项式提议生成模块、PolySampler、偏移网络以及多尺度可变形注意力解码器。主干网络负责提取图像的多尺度特征,而混合编码器则结合了自注意力机制,使模型能够更好地捕捉图像中的上下文信息。多项式提议生成模块通过logits头选择最具潜力的作物行,然后利用MLP回归这些行的多项式系数。PolySampler和偏移网络则用于进一步优化这些提议,使其更接近真实行结构。最后,多尺度可变形注意力解码器通过关注重要的空间区域,提高行检测的精度。

为了处理标签噪声和不确定性,RowDetr引入了一种基于能量的损失函数PolyOptLoss。该损失函数通过计算预测曲线与真实曲线之间的几何对齐误差,使模型在训练过程中更精确地调整多项式参数。此外,为了确保预测结果与真实行之间的一一匹配,RowDetr还采用了匈牙利算法进行最优匹配,从而简化了训练流程,避免了诸如非极大值抑制(NMS)等后处理步骤。这一设计不仅提升了模型的鲁棒性,还保证了在实际应用中的稳定性。

在数据集方面,RowDetr使用了多种设备采集的图像,包括手持设备、Basler相机以及RealSense D435i,这些图像覆盖了不同作物阶段和环境条件。为了提高模型的泛化能力,图像被调整为统一的尺寸,并在训练过程中进行了多种数据增强,如仿射变换、模拟天气效果、颜色抖动、运动模糊和随机裁剪。这种多样化的数据集使得RowDetr能够在不同的田间条件中表现良好。

实验结果表明,RowDetr在多项个数、平均LPD(车道位置偏差)和TuSimple F1分数等方面均优于其他现有的端到端作物行检测方法,如AgroNav和RowColAttention。例如,在使用ResNet18作为主干网络的情况下,RowDetr的推理延迟仅为6.7毫秒,经过INT8量化优化后,延迟进一步降低至3.5毫秒,远低于其他方法的延迟。同时,RowDetr的参数数量也显著低于其他模型,这使其在边缘计算设备上的部署更具可行性。

此外,通过消融实验,研究者进一步分析了不同参数配置对模型性能的影响。结果显示,当采样点数为3,偏移点数为2时,RowDetr在多项式对齐误差(LPD)和F1分数方面达到了最佳平衡,这一配置在保证高精度的同时,也保持了较低的计算延迟。因此,这种配置被推荐用于实际部署。

在实际应用中,RowDetr展现出显著的优势。特别是在处理密集作物覆盖、行结构复杂以及存在遮挡和杂草干扰的情况下,该模型能够保持较高的检测准确性和稳定性。与传统方法相比,RowDetr无需依赖后处理步骤,即可直接输出结构化的多项式参数,从而在实时性方面表现出色。这种端到端的检测方式,不仅提高了系统的整体效率,还增强了其在复杂农业环境中的适应能力。

值得注意的是,尽管RowDetr在许多方面表现出色,但仍存在一些局限性。例如,在高度不规则的环境(如森林)中,其假设作物行是光滑的曲线,可能无法准确识别复杂结构。此外,目前的数据集主要针对玉米和高粱等作物,尚未扩展到其他作物类型,这可能会影响其在更广泛农业场景中的适用性。因此,未来的研究可以进一步扩展数据集,使其适用于更多类型的作物和不同的田间条件。

从实际影响来看,RowDetr的提出为农业自动化提供了重要的技术支持。其高效的检测能力和对复杂环境的适应性,使得自主机器人能够在GPS信号不可用的情况下,准确地识别作物行,从而实现精准的田间导航和作业。这不仅有助于提高农业生产的效率,还为未来智能农业的发展奠定了基础。

总体而言,RowDetr通过其创新的多项式参数化方法和优化的端到端架构,在作物行检测领域取得了显著进展。其在实际应用中的高效性和鲁棒性,使其成为农业机器人和自主农业设备的理想选择。未来,随着数据集的扩展和多模态传感器的融合,RowDetr有望在更广泛的农业场景中发挥更大作用,推动农业智能化的进一步发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号