基于自监督深度强化学习的遮挡环境下葡萄采摘视点规划方法

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年08月30日 来源：Computers and Electronics in Agriculture 8.9

编辑推荐：

　　本文提出了一种创新的基于自监督深度强化学习（SS-DRL）的视点规划方法，通过设计2D图像遮挡区域面积与位置特征的奖励函数，结合自监督卷积网络（SSCN）动态评估动作有效性，显著提升了葡萄茎秆检测成功率（较基线方法提升37.2%）和网络训练效率（收敛速度加快1.8倍），为复杂农业场景下的机器人精准采收提供了新范式。

亮点

本研究创新性地将自监督学习机制融入深度强化学习框架，通过历史成功经验数据生成自监督信号，实现了对策略网络奖励函数的动态优化。相较于传统依赖3D重建的方法，本方案直接在2D图像空间构建遮挡评估体系，大幅降低了计算复杂度。

材料与方法

系统包含四大模块：1）状态-动作空间设计；2）自监督深度Q网络（SS-DQN）架构；3）融合遮挡面积与空间位置的奖励函数；4）基于SSCN的学习策略。其中SSCN通过动作评估算法（AEA）实时生成伪标签，指导策略网络进行高效探索。

评估

在多视角葡萄数据集和真实户外场景的对比实验中，本方法茎秆检测成功率达到92.4%，较传统NBV方法提升28.6%，网络训练周期缩短40%。特别是在密集叶簇遮挡场景下，系统通过3-5次视点调整即可定位切割点。

结论

该视点规划方案通过SS-DQN网络实现了：1）增强型状态空间表征；2）精细化奖励机制；3）SSCN驱动的策略优化。实验证明其能有效解决葡萄茎秆完全遮挡的行业难题，为农业机器人主动感知技术提供了新思路。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号