编辑推荐:
为解决苹果实时检测在精度和速度方面的难题,研究人员开展了基于平行深度可分离多尺度信息聚合网络(PDSMIA Net)的研究。结果显示该方法准确率达 74.96%,帧率 100FPS,优于其他算法,满足实时检测需求。
在水果的世界里,苹果不仅产量高,而且深受大众喜爱。然而,苹果产业面临着严峻的挑战。一方面,它是劳动密集型和成本密集型产业,如今劳动力短缺和成本上升,严重影响了其盈利能力和可持续发展。为了缓解这些问题,开发采摘机器人迫在眉睫,而水果检测作为采摘机器人的关键一环,其准确性和效率至关重要。此外,精准高效的检测技术对于产量预测以及病虫害监测也意义重大。
随着科技的发展,深度学习算法在水果检测领域崭露头角。它无需人工干预,就能智能学习物体的复杂特征,比传统方法更具优势。众多研究人员为了提升检测性能,不断对现有算法进行改进,比如针对果园环境中光照变化、果实叶片细微生长特征等情况进行优化。但是,这些算法在实际工程应用中仍存在问题。它们对硬件要求较高,检测速度和准确性也不尽如人意。而且,以往大多研究是基于测试数据集,直接应用到实际果园环境时,由于光照、相机等因素影响,会出现大量检测错误和延迟。在复杂的果园背景下,苹果常常密集聚集且相互遮挡,进一步增加了实时检测的难度。
在这样的背景下,国内研究人员积极开展研究。他们以 YOLOv7 为基础框架,构建了平行深度可分离多尺度信息聚合网络(PDSMIA Net),旨在提高水果检测的速度、准确性以及硬件友好性。这一研究成果发表在《Computers and Electronics in Agriculture》上,为苹果实时检测带来了新的突破。
研究人员在开展这项研究时,主要运用了以下关键技术方法:构建了平行深度可分离空间特征提取网络(PDSSFEN),它包含多通道平行深度可分离特征提取模块(MPDSFEM)、平行深度可分离下采样模块(PDSDM)和 SimSPPFCSPC,以此增强空间信息提取能力并减少参数数量;提出多尺度上下文信息聚合网络(MCIAN),利用自上而下的多侧向连接和基于特征金字塔网络(FPN)的特征融合结构,融入更多语义信息;采用 Focal-CIOU 损失函数,使网络能更好地匹配数据集分布。
研究结果主要通过以下几个方面呈现:
- 网络性能验证:在测试数据集上进行实验,验证了 PDSMIA Net 的网络优越性。这表明该网络在处理数据、提取特征等方面具有出色的表现,为后续在实际场景中的应用奠定了基础。
- 模块结构和损失函数验证:通过消融实验,验证了所提出的模块结构和损失函数的有效性。这意味着 PDSSFEN 和 MCIAN 模块以及 Focal-CIOU 损失函数对于提升网络性能起到了关键作用,它们各自的设计和功能得到了充分的验证。
- 对比实验:将 PDSMIA Net 与 YOLOv7、Faster R-CNN、SSD、YOLOv5 和 YOLOv8 等流行方法进行对比。结果显示,PDSMIA Net 在实时检测方面表现卓越,在帧率为 100FPS 的情况下,准确率达到 74.96%,超越了其他算法。这一成果直观地展示了 PDSMIA Net 的优势,为其在实际工程应用中的推广提供了有力依据。
在研究结论和讨论部分,PDSMIA Net 展现出显著的优势。在训练和推理阶段,该网络参数较少,在检测速度和准确性方面表现出色,具有良好的硬件兼容性,更适合工程应用。这一研究成果为果园环境下的苹果实时检测提供了一种高效、可靠的方法,有望推动苹果采摘机器人的发展,缓解苹果产业面临的劳动力问题,提高生产效率。同时,也为其他水果检测以及农业相关领域的研究提供了新的思路和方法,对农业智能化发展具有重要的意义。它打破了传统检测方法的局限,为农业领域的深度学习应用开辟了更广阔的前景,让人们看到了科技在农业现代化进程中的巨大潜力。