基于路径中心化蚂蚁启发的全景记忆模型实现类车机器人的双向路径跟随

【字体: 时间:2025年09月26日 来源:Nature Communications 15.7

编辑推荐:

  本研究针对自主导航机器人资源受限下的长距离路径跟随难题,受蚂蚁高效导航机制启发,提出了一种基于路径中心化侧向记忆的全景路由学习与跟随神经形态模型。研究团队在Antcar类车机器人上实现了双向路径导航、端点识别及 familiarity 自适应速度控制,通过李雅普诺夫稳定性分析与大规模实证测试(113次试验,总里程1.6 km),证实系统在仅需800像素输入、300 MB内存和18.75 kB/50米路由的极低资源消耗下,实现中位横向误差<25 cm的性能突破,为昆虫认知研究与资源约束下的自主机器人技术提供了重要理论与实践支撑。

  
在自主机器人技术飞速发展的今天,如何让机器像蚂蚁一样在复杂环境中高效导航,成为困扰研究者们的重大挑战。尽管现代机器人搭载了各种先进传感器和强大算力,但它们仍然难以匹敌孤独觅食蚂蚁在路径跟随任务中展现出的卓越性能——这些微小昆虫仅凭有限的神经资源就能在漫长旅途中精准导航,而机器人却往往受限于计算效率、环境动态性和资源约束。这一矛盾激发了跨学科研究者的浓厚兴趣,从生物学到机器人学,人们迫切希望揭开昆虫导航的奥秘,并将其转化为实用的自主系统技术。
传统视觉导航方法如"视觉教导与重复"(Visual Teach & Repeat)结合航位推测法虽被广泛应用,但存在严重依赖里程计、内存需求随路径增长而剧增、计算效率低下等问题。更令人遗憾的是,当前受蚂蚁启发的模型大多局限于短距离实验(约十米)或模拟环境,且需要机器人进行耗时的强制扫描运动,严重限制了实际应用价值。昆虫研究表明,蚂蚁利用蘑菇体(Mushroom Body, MB)这一关键脑区进行视觉学习,通过肯扬细胞(Kenyon Cells, KCs)稀疏编码感官输入,再通过蘑菇体输出神经元(Mushroom Body Output Neurons, MBONs)调节行为反应。然而,如何将这一神经机制转化为能够在真实世界中稳定运行的机器人系统,仍然是一个悬而未决的难题。
正是在这样的背景下,法国艾克斯-马赛大学、图卢兹大学等机构的研究团队在《Nature Communications》上发表了这项突破性研究。他们开发了一个完全具身化的、生物可信的路径跟随系统,将路径中心化侧向视觉记忆、全景输入编码和神经形态控制统一集成到真实机器人平台中。
研究团队采用了几项关键技术方法:首先使用单个32×32像素全景相机采集环境信息,通过高斯平滑和Sobel边缘检测模拟昆虫视觉预处理;然后构建包含15,000个肯扬细胞的神经网络进行稀疏编码;采用路径中心化自监督学习机制,通过模拟扫描实现38 Hz的学习速率;利用李雅普诺夫稳定性理论证明系统收敛性;并通过GPS-RTK和Vicon运动捕捉系统进行精度验证。实验涵盖室内外多种环境,总测试距离达1.6公里。
Self-supervised route-centric lateralized memories model
研究人员首先开发了基于路径中心化侧向记忆的自监督学习模型。该系统通过连续模拟旋转全景图像,结合路径中心化假设,驱动自监督路径学习机制。实验结果表明,在控制学习期间的振荡幅度时,模型能够基于微分熟悉度(λdiff)准确估计航向误差,室内外分别可处理高达135°和90°的角度偏差。最大熟悉度指数(λmax)则与航向误差成正比增加,使机器人能够在与路径不对齐时减速。这种特性即使在机器人被横向移离路径时仍然保持稳定。
稳定性分析证实,系统在横向误差(d)2米和角度误差(θe)在学习振荡幅度(设为45°)内能够保持稳定行为。通过李雅普诺夫函数分析,证明系统能够在de=0和θee=0的平衡点收敛,有效纠正小偏差并使机器人保持与学习路径对齐。
Route-following: robustness to visual changes
在路径跟随鲁棒性测试中,研究团队进行了系列室内外实验。Antcar机器人成功在杂乱室内环境中导航两条约8米长的路径,仅使用两个MBONs就实现了0.21±0.09米的中位横向误差和3.4±6.2°的角度误差。在"绑架"测试中(将机器人位移1-2米并旋转0-50°),性能仍然保持稳定。
照明适应性测试显示,尽管仅在标准照明(815 Lux)下进行单次学习试验,机器人在明亮(1340 Lux)和昏暗(81 Lux)条件下都能准确跟随路径,且在不同测试中保持相似的横向和角度误差,表明基于路径中心化MB的控制系统对光照变化具有强鲁棒性。
在动态环境中,当遇到行人和相机遮挡时,机器人仍保持可靠的路径跟随性能。行人干扰下的横向误差为0.27±0.15米,角度误差为4±2.8°;动态遮挡下的横向误差为0.22±0.13米,角度误差为4.7±3.3°。存在行人和遮挡时,最大熟悉度降低导致速度减慢和振荡运动增加——比无干扰实验慢约15%。
户外实验证明了模型在多样化环境中的鲁棒性,从1.5米宽的树林环境到5米宽的半城市路线,在静态遮挡和改变条件下都保持稳定性能。在半阴天学习的20米路径能够准确重现,误差较低(横向误差0.3±0.12米;角度误差4±2.3°)。引入静态遮挡(固定黑点覆盖整个视野的4-15%)后,性能仍然稳健。
在55米路径的改变条件下测试中,机器人在晴朗天气下导航误差较低(横向误差0.39±0.13米;角度误差5.8±2.8°)。第二天同一时间,在移走停放汽车且速度增益更高(巡航1.5 m/s vs 1 m/s)的情况下,误差略有增加但仍处于可接受范围内。
Homing: homeward route and stop
在归巢行为测试中,研究人员评估了机器人逆向跟随50米户外路径并在指定巢区停止的能力。学习期间,视觉振荡模式的180°偏移模拟了蚂蚁中观察到的"回头查看"行为,实现了归巢路径跟随。
机器人在多云户外条件下成功逆向跟随50米路径(横向误差0.9±0.5米,角度误差6.3±4.2°)。为实现在巢穴自动停止,使用特定位置MBON学习路径起点的"巢穴视图",随后基于熟悉度阈值的"识别"作为动机线索,停止路径跟随行为并降低机器人线速度。这一机制使机器人在5次试验中有4次成功到达并停止在巢区,中位停止距离1.4米。
Shuttling: foodward and homeward routes
在往返穿梭测试中,机器人成功复制了蚂蚁中常见的逆向路径跟随行为。通过加入两个额外位置MBONs,学习定义路径每个端点(喂食器和巢穴)的一系列全景视图,在识别这些对应喂食器或巢穴区域的全景视图时触发电机增益极性切换。
在杂乱室内环境中沿6米学习路径,机器人在喂食器和巢穴之间自主往返穿梭,总距离160米无中断。使用两个路径端点MBONs上的类似熟悉度阈值,机器人检测到端点22次,中位停止距离0.31米。
连续穿梭显示前进和后退运动间的错误分布存在明显差异。前进运动期间,机器人保持稳定控制,偏差极小(横向误差0.1±0.03米,角度误差1.26±0.83°)。然而后退运动期间,牵引驱动设置放大了转向效应,导致准确性和精密度偏差略大,但整体性能仍可接受(横向误差0.19±0.08米,角度误差2.7±2.1°)。增加的"电机"变异性导致视觉识别信号降低,进而影响速度,比前进运动降低14%。尽管如此,机器人始终能在轻微偏差后重新对齐正确路径。
Performance summary
在所有实验中,包括室内外路径跟随、归巢和往返任务,模型展示了强大而稳定的导航性能,完成113条自主轨迹,总行驶1.6公里。系统理论极限得到验证,在各种环境条件下甚至存在噪声时都能持续收敛到平衡点(中位横向误差0.24±0.13米,中位角度误差4.1±2.7°)。这些误差在室内外环境中都保持在安全范围内,与法国道路标准宽度(5米)和典型室内走廊(1.5米)对齐。
统计分析显示不同实验场景间横向或角度误差无显著差异(Kruskal-Wallis检验,横向误差H=2.10,p=0.99;角度误差H=8,p=0.76),强调了系统在多样化条件下的可靠性。
Steering memory capacity
在经典单MBON熟悉度模型中,内存容量(m)由错误概率(Perror)定义,即混淆不熟悉视觉模式与学习模式的几率。在选定参数(N=15,000, K=0.01)下,理论估计预测内存容量为m=346个KC活动模式,相当于杂乱环境中约38米路径。然而,这类二分类度量无法捕捉路径中心化侧向MBON转向机制的复杂性。
为更好量化模型转向特定内存性能,研究人员提出经验度量(Plerror),定义为错误激活相反MBON的视觉模式比例。根据这一度量,在半城市环境扩展路径跟随实验(55米,430个独特KC活动模式)中,网络实现0.7%错误率,低于1%混淆概率的关键阈值。使用更大数据集(达250米)的内存可扩展性分析表明,在当前网络参数下,1%错误概率估计产生500个模式,对应约65米路径。外推表明,更大网络(N=100,000, K=0.005)可将容量扩展到1000个模式,对应130米路径,同时保持1%错误阈值。
研究结论与讨论部分指出,这项工作引入了完全具身化、生物基础的路径跟随系统,将路径中心化侧向视觉记忆、全景输入编码和神经形态控制统一在真实机器人平台中。与先前限于短程任务或模拟的蚂蚁启发模型不同,该模型提供连续、单次学习和稳定双向视觉路径导航——仅使用单个800像素传感器、四个MBONs和最小计算资源。
智能体头部方向与动态局部路径方向之间的角度误差(即路径中心化,在方法中定义为Frenet帧)在利用期间(系统倾向于最小化此误差)和学习期间(分类过程依赖于其极性)都作为挑战出现。模型通过视觉振荡180°偏移或反转电机增益展示归巢行为,从而实现前进和后退运动,且仅需单次觅食路径学习。此外,存储在补充MBONs中的视觉位置记忆与动机控制系统配对,使机器人能够识别路径端点并调节电机增益,停止运动或反转觅食动机。
与早期蚂蚁启发熟悉度模型相比,通常限于短距离室内路径或停止扫描策略,该系统在可扩展性、效率和真实世界适应性方面展示出实用优势。内存占用和命令计算时间显著低于全景视觉路径跟随方法报告的要求(每公里3兆字节和每控制更新400毫秒)。相比之下,该模型以每公里0.3兆字节运行,并在轻量嵌入式板上75毫秒内产生命令——实现在受限平台中的实时操作。
这项研究解决了具身神经形态智能研究中确定的几个核心需求,如对视觉变化的鲁棒性、对真实环境的适应性以及扩展路径学习的支持。算法效率为附加任务留出计算能力,使其在GPS受损或SLAM(同步定位与地图构建)中断场景中具有价值。机器人的低分辨率广角视觉证明对经常破坏SLAM的移动物体具有弹性。
该模型在动态环境或传统里程计(无论是视觉、惯性、步数计数还是车轮旋转)不可靠的场景中特别有效。它可以作为低资源备份系统(在4核CPU上运行)与其他进程并行,或与额外传感器集成以增强状态估计鲁棒性。
有趣的是,半随机编码过程,特别是PN到KC的突触投射,引入了"故障安全"内存共享机制。如果编码的突触权重不同,内存共享变得不可访问,这对群体机器人或跨机器人内存共享是有利特性。未来研究可通过测试具有反馈或预测误差的不同MB学习机制,调整KCs数量或连接性来增强这种方法。
最后,该系统的内存容量度量(500个模式)高于Ardin等人的理论估计(346个模式)。这种差异可能出现是因为理论模型假设随机、独立的KC激活,而在连续路径学习中,KC激活是相关和结构化的。此外,经验错误计算依赖于视觉预处理、硬件和半城市环境。这里计算的内存容量错误可以与KC到MBON突触权重的稀疏性相关联,避免当所有KCs都被使用时可能发生的剧烈遗忘(即KC到MBON向量为0)。
受蚂蚁神经行为学启发,路径中心化侧向MB模型为昆虫启发机器人导航的理论见解与实际应用之间提供了有效桥梁。这一自我中心架构展示了生物可信神经回路如何支持真实世界机器人中的强大、可扩展和自适应行为——使用可访问硬件、全景输入和最小计算资源。这些结果强化了神经形态方法对具身自主性的承诺,并拓宽了机器人系统和比较认知实验研究的机会。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号