基于自监督深度强化学习的遮挡环境下葡萄采摘视点规划方法

【字体: 时间:2025年08月30日 来源:Computers and Electronics in Agriculture 8.9

编辑推荐:

  本文提出了一种创新的基于自监督深度强化学习(SS-DRL)的视点规划方法,通过设计2D图像遮挡区域面积与位置特征的奖励函数,结合自监督卷积网络(SSCN)动态评估动作有效性,显著提升了葡萄茎秆检测成功率(较基线方法提升37.2%)和网络训练效率(收敛速度加快1.8倍),为复杂农业场景下的机器人精准采收提供了新范式。

  

亮点

本研究创新性地将自监督学习机制融入深度强化学习框架,通过历史成功经验数据生成自监督信号,实现了对策略网络奖励函数的动态优化。相较于传统依赖3D重建的方法,本方案直接在2D图像空间构建遮挡评估体系,大幅降低了计算复杂度。

材料与方法

系统包含四大模块:1)状态-动作空间设计;2)自监督深度Q网络(SS-DQN)架构;3)融合遮挡面积与空间位置的奖励函数;4)基于SSCN的学习策略。其中SSCN通过动作评估算法(AEA)实时生成伪标签,指导策略网络进行高效探索。

评估

在多视角葡萄数据集和真实户外场景的对比实验中,本方法茎秆检测成功率达到92.4%,较传统NBV方法提升28.6%,网络训练周期缩短40%。特别是在密集叶簇遮挡场景下,系统通过3-5次视点调整即可定位切割点。

结论

该视点规划方案通过SS-DQN网络实现了:1)增强型状态空间表征;2)精细化奖励机制;3)SSCN驱动的策略优化。实验证明其能有效解决葡萄茎秆完全遮挡的行业难题,为农业机器人主动感知技术提供了新思路。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号