分布式多机器人主动信息采集:非均匀农业与林业环境中的多目标搜索与跟踪算法创新

《Frontiers in Plant Science》:Distributed multi-robot active gathering for non-uniform agriculture and forestry information multi-robot active gathering

【字体: 时间:2025年10月23日 来源:Frontiers in Plant Science 4.8

编辑推荐:

  本文提出一种基于分布式伯努利汤普森采样(Bernoulli Thompson Sampling)与劳埃德算法(Lloyd's algorithm)结合的多机器人协同控制策略,用于非均匀分布环境下的多目标(Multi-Target Tracking, MTT)搜索与跟踪。该方法将信息采集问题建模为多臂老虎机(MAB)问题,通过动态目标概率假设密度滤波(PHD Filter)实现目标状态估计,提升机器人在探索(exploration)与利用(exploitation)之间的权衡能力,显著提高了目标覆盖率和搜索效率,尤其适用于农业监测、林业资源调查等场景。

  
1 引言
主动信息采集是多机器人系统在农业和林业领域中的核心任务,应用范围包括精准播种、田间管理、智能除草与病虫害防控等。传统分布式策略往往难以适应信息非均匀分布的环境,导致目标检测速度慢、覆盖效率低。本文创新性地将信息采集问题重构为多臂老虎机(Multi-Armed Bandit, MAB)问题,并提出一种新型分布式伯努利汤普森采样算法(Distributed Bernoulli Thompson Sampling),使机器人在共享概率信息的同时进行探索-利用决策,从而在没有集中控制的情况下实现全局协同。
2 方法
2.1 问题建模
假设有nt个目标状态X={x1,,xnt}分布于凸开放任务空间E?R2中,nr个机器人需协同探测与跟踪这些目标。每个机器人通过机载传感器获取有限视野(Field of View, FoV)内的噪声测量值Zi,且存在漏检与误检情况。
2.1.1 PHD滤波器
目标与测量集合均为随机有限集(Random Finite Set, RFS),其一级矩为概率假设密度(Probability Hypothesis Density, PHD),记为v (x)。PHD滤波器通过预测与更新步骤递归传播目标空间密度,模型包括目标运动模型f(x|ξ)、存活概率ps(x)、新生目标PHDb(x),以及检测概率pd(x|q)、测量模型g(z|x,q)和杂波PHDc(z|q)。其递推方程为:
vˉt(x)=b(x)+Ef(x|ξ)ps(ξ)vt-1(ξ)?dξ
(1)
vt(x)=(1-pd(x|q))vˉt(x)+zZtψz,q(x)vˉt(x)ηz(vˉt)
(2)
2.1.2 劳埃德算法
劳埃德算法通过最小化目标函数?({q1,,qnr})实现分布式控制,其梯度与机器人状态无关。机器人移动至其Voronoi单元的加权质心:
qr*=Vrx?(x)dxVr?(x)dx
控制输入为:
ur(g)=min (dstep,g-qr)g-qrg-qr
2.2 分布式伯努利汤普森采样
2.2.1 搜索问题建模为MAB问题
将搜索任务建模为多臂老虎机问题,每个动作k代表机器人移动到环境中的一个特定区域,奖励为二元值:
rwk={0Z=?1else
环境E被划分为K个固定区域,每个区域中心对应一个采样位置sk
2.2.2 汤普森采样
汤普森采样(Thompson Sampling, TS)通过Beta分布对每个资源的奖励概率进行建模,参数更新使用动态调整策略:
(αk,βk)={(αk+rwk,βk+(1-rwk)),αk+βk<CCC+1(αk+rwk,βk+(1-rwk)),otherwise
2.3 多目标信息采集的整体策略
机器人根据是否跟踪到目标分为搜索组(Rs)和跟踪组(Rt)。跟踪机器人使用劳埃德算法,空闲机器人使用TS算法选择探索区域。通过目标交换策略优化任务分配,减少总移动距离。
3 结果
3.1 仿真环境
任务空间为100 m × 100 m的正方形,目标静止或以3 m/s速度运动。机器人最大速度10 m/s,传感半径5 m。环境被划分为14×14的网格,PHD滤波中使用高斯随机游走模型。
3.2 定性对比
在目标非均匀分布环境中,纯劳埃德算法导致大量机器人处于空闲状态,目标跟踪效率低。结合TS算法后,机器人能快速学习目标分布,聚集于高目标密度区域,显著提升搜索与跟踪效率。
3.3 定量分析
使用最优子模式分配(OSPA)误差度量算法性能。结果表明,在静态和动态目标场景下,结合TS的方法均能降低OSPA误差和上升时间,尤其在目标聚集分布的环境中效果更为显著。
4 结论
本文提出的分布式主动搜索与跟踪算法,通过结合汤普森采样和劳埃德算法,使多机器人系统在非均匀分布环境中能高效协同工作,显著提升目标搜索速度与跟踪精度,为农业、林业等领域的应用提供了有效的技术解决方案。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号