利用深度强化学习和数字孪生系统实现自主水下车辆的智能对接控制
《Expert Systems with Applications》:Intelligent docking control of autonomous underwater vehicles using deep reinforcement learning and a digital twin system
【字体:
大
中
小
】
时间:2025年07月25日
来源:Expert Systems with Applications 7.5
编辑推荐:
数字孪生与深度强化学习的智能水下机器人对接系统研究。摘要:本研究提出一种集成深度强化学习(DRL)和数字孪生(DT)模拟平台的自主水下机器人(AUV)智能对接控制系统,采用YOLOv7模型实现实时视觉检测,通过DDPG算法在非线性水动力条件下控制深度和轨迹。基于Python、MATLAB和Unity开发了定制化数字孪生系统,成功实现从仿真到现实的控制策略迁移,并在静态与动态对接场景中验证了系统的鲁棒性和精准性,为非结构化水下环境智能机器人应用提供新范式。
本研究提出了一种用于自主水下航行器(AUV)的智能对接控制系统,将深度强化学习(DRL)与数字孪生(DT)仿真平台相结合。通过引入You Only Look Once(YOLO)目标检测模型,实现了对接站点的实时视觉识别,同时采用Deep Deterministic Policy Gradient(DDPG)算法来控制AUV的深度和轨迹,以应对非线性水动力学条件下的复杂运动。为了训练DDPG和基于图像的DDPG(I-DDPG)控制器,开发了一个定制化的数字孪生系统,利用Python、MATLAB和Unity生成模拟的传感器数据和图像数据。与传统和监督控制策略相比,所提出的基于Actor-Critic的DRL方法在视觉辅助水下对接中表现出更强的适应性和连续控制能力。在拖曳水池中的实验验证表明,训练好的控制器能够成功从仿真环境迁移至现实环境,保持在静态和动态对接场景中的鲁棒性。这些结果验证了将DRL与数字孪生结合在非结构化水下环境中实现可靠、精确控制的可行性,展示了该系统在智能海洋机器人应用中的潜力。
自主水下航行器的机动性本质上涉及在多个相互关联的自由度(DOFs)下的复杂和非线性运动。它们的操作受到不可预测的水下动态条件的影响,包括变化的洋流、光学障碍、声学干扰和不规则地形,这给控制带来了重大挑战,尤其是在对接操作时。在这些场景中,AUV必须表现出极高的精度,以准确地定位自身并安全地进入对接站点。因此,推进对接技术对于提高AUV任务成功率和操作效率至关重要。
深度强化学习(DRL)作为一种在复杂和动态环境中控制问题的解决方案,展现出巨大的潜力。DRL允许智能体通过与环境的持续交互和反馈来优化决策策略。对于涉及连续和高维动作空间的应用,Deep Deterministic Policy Gradient(DDPG)算法具有特别的优势,它采用Actor-Critic框架输出连续动作,并改进了非线性控制任务的处理能力。此外,除了基于声呐的感知技术,光学仪器在AUV的感知系统中也变得越来越重要,能够实现实时监控和目标识别。随着神经网络和深度学习(DL)技术的进步,基于视觉的系统在准确性和可靠性方面得到了显著提升。例如,Li等人(2015)利用快速R-CNN进行水下鱼类物种的识别,Nguyen等人(1988)展示了实时图像识别在AUV控制中的应用。基于视觉的对接方法也受到了研究,Park等人(2009)实现了基于机载摄像头检测的对接中心坐标和PID控制,而Lee等人(2003)则应用了光学流融合和6-DOF动态建模进行姿态调整。
不同于传统的基于滑动窗口的目标检测方法,You Only Look Once(YOLO)算法将目标检测问题重新定义为一个单一的回归问题,显著提高了处理速度而不会牺牲精度(Redmon等人,2016)。此外,YOLO能够确保空间一致性,并同时检测多个目标,使其在实时水下应用中非常合适(Cao等人,2022,Li等人,2023)。近年来,深度学习的发展使得目标检测模型更加先进,特别是YOLOv7(Wang等人,2022),它是早期YOLO版本的优化继任者。YOLOv7引入了扩展的Efficient Layer Aggregation Networks(ELANs)、动态标签和锚点分配策略以及模型重参数化技术,从而提高了计算效率和检测精度。该算法在一张图像上执行一次计算,同时预测目标类别和位置,从而实现了比之前方法更快和更精确的目标检测。
尽管有了这些进展,直接在物理环境中训练DRL策略仍然昂贵且耗时。因此,越来越多的仿真环境被用于预训练,水下仿真器如UWSim(Prats等人,2012)和MORSE(Echeverria等人,2011)提供了有价值的平台。然而,商用仿真器在定制车辆和环境参数方面的灵活性有限,表明需要更适应的数字孪生(DT)系统。
数字孪生系统最初被设想为物理系统的高保真虚拟复制品(Grieves,2014,Liu等人,2021),能够精确建模物理行为和环境交互。数字孪生系统通过双向数据交换连接现实与虚拟世界,增强控制器的训练能力,同时避免了现实实验中的风险和成本。在海事应用中,Yang等人(2022)提出了基于数字孪生的水下滑翔机路径规划系统,Major等人(2021)展示了数字孪生原型在远程船舶监控中的应用,Lee等人(2022)则开发了一个实时数字孪生系统,用于预测船舶水动力学并优化航线。
本研究的其余部分组织如下。第2节描述了AUV的设计、可变信息对接站(VID)以及相关的控制策略。第3节介绍了数字孪生系统架构。第4节概述了控制实现和实验设计。第5节讨论了实验验证和性能分析。最后,第6节总结了本研究的主要创新和贡献。
本研究提出了一种基于视觉的智能对接系统,用于自主水下航行器(AUV),该系统集成了多个模块,包括AUV硬件设计、对接站点、模糊逻辑控制、基于图像的目标检测以及由深度强化学习(DRL)驱动的运动控制。整个系统利用光学感知进行实时环境感知,并通过多领域控制策略实现自主对接。为了确保空间一致性,建立了三种坐标系统:地球固定坐标系、AUV坐标系和对接站点坐标系。这些坐标系统之间的转换和同步是实现精确对接的关键环节。
为了实现I-DDPG对接控制算法的鲁棒性和样本效率,本研究开发了一个数字孪生系统,该系统模拟了AUV在真实水下环境中的物理动态和视觉感知。数字孪生系统通过应用编程接口(API)集成了多种软件平台,包括MATLAB、Unity和Python,从而建立了统一且互操作的仿真体系结构(图8)。每个组件在该系统中都具有明确的功能和交互方式,确保了模拟环境的准确性和灵活性。此外,数字孪生系统能够生成与真实环境相似的传感器数据和图像数据,为DRL控制器的训练提供了丰富的数据支持。
本研究的控制实现和实验设计涵盖了多个阶段。首先,介绍了模糊逻辑控制(FLC)在对接系统中的应用,用于控制AUV的航向。其次,详细描述了DDPG算法在潜水和深度保持控制中的训练过程,通过数字孪生系统模拟了AUV在复杂水动力学条件下的运动行为。最后,介绍了I-DDPG视觉引导的仿真过程,结合数字孪生系统对AUV的视觉识别和运动控制进行了综合测试。实验设计不仅包括静态对接测试,还涵盖了动态对接测试,以验证控制器在不同环境条件下的适应性和鲁棒性。
实验结果部分展示了在数字孪生框架下训练的视觉控制系统的水下对接验证情况。实验包括静态和动态对接测试,每个测试包含三个成功的对接案例,如表9所示。对接过程被分为三个阶段进行分析:定位阶段(0–37秒)、搜索阶段(38–48秒)和对接阶段(48秒至结束)。这些阶段的划分有助于更细致地评估控制器在不同任务阶段的表现。在定位阶段,AUV需要准确地识别对接站点并进行初步定位;在搜索阶段,AUV需要在周围环境中寻找最佳的对接路径;在对接阶段,AUV需要精确地调整姿态和轨迹,以确保安全地进入对接站点。
本研究的结论部分总结了数字孪生系统在AUV对接控制中的开发,该系统通过Python、MATLAB和Unity模拟了水下动态和视觉感知。系统支持基于深度强化学习的训练,并通过现实世界的水下对接实验验证了其有效性,解决了仿真到现实的迁移问题。本研究的主要创新和贡献包括:
1. 提出的数字孪生系统能够高效模拟AUV在复杂水下环境中的物理动态和视觉感知,为深度强化学习控制器的训练提供了可靠的仿真平台。
2. 结合YOLO目标检测模型和DDPG算法,实现了基于视觉的自主对接,提高了系统的适应性和控制精度。
3. 通过实验验证,证明了训练好的控制器能够成功从仿真环境迁移至现实环境,保持在静态和动态对接场景中的鲁棒性。
4. 开发的数字孪生系统具有高度的可定制性和灵活性,能够支持多种控制策略的训练和验证,为未来的研究提供了坚实的基础。
本研究的成果不仅为AUV的对接控制提供了新的解决方案,也为智能海洋机器人领域的发展做出了重要贡献。通过将深度强化学习与数字孪生技术相结合,本研究展示了在非结构化水下环境中实现可靠、精确控制的可行性,为未来在复杂海洋环境中的自主导航和任务执行提供了新的思路和技术支持。
在实际应用中,数字孪生系统能够为AUV的开发和测试提供一个安全、高效的虚拟环境,避免了现实实验中的高成本和高风险。同时,深度强化学习算法能够通过不断学习和优化,提高AUV在复杂环境中的适应能力和自主性。本研究提出的系统不仅在理论上具有创新性,而且在实践中得到了验证,证明了其在水下对接任务中的有效性。
此外,本研究还强调了跨学科技术融合的重要性。通过结合计算机视觉、深度学习和数字孪生技术,本研究为AUV的智能控制提供了新的方法。这种跨学科的方法不仅提高了系统的性能,还为未来的研究提供了更多的可能性。例如,可以进一步探索基于多模态感知的控制策略,结合声呐、光学和雷达等多种传感器数据,以提高AUV在复杂环境中的感知能力和控制精度。
在实际应用中,数字孪生系统能够为AUV的开发和测试提供一个安全、高效的虚拟环境,避免了现实实验中的高成本和高风险。同时,深度强化学习算法能够通过不断学习和优化,提高AUV在复杂环境中的适应能力和自主性。本研究提出的系统不仅在理论上具有创新性,而且在实践中得到了验证,证明了其在水下对接任务中的有效性。
本研究还强调了跨学科技术融合的重要性。通过结合计算机视觉、深度学习和数字孪生技术,本研究为AUV的智能控制提供了新的方法。这种跨学科的方法不仅提高了系统的性能,还为未来的研究提供了更多的可能性。例如,可以进一步探索基于多模态感知的控制策略,结合声呐、光学和雷达等多种传感器数据,以提高AUV在复杂环境中的感知能力和控制精度。
在实际应用中,数字孪生系统能够为AUV的开发和测试提供一个安全、高效的虚拟环境,避免了现实实验中的高成本和高风险。同时,深度强化学习算法能够通过不断学习和优化,提高AUV在复杂环境中的适应能力和自主性。本研究提出的系统不仅在理论上具有创新性,而且在实践中得到了验证,证明了其在水下对接任务中的有效性。
本研究的成果表明,数字孪生和深度强化学习的结合能够有效解决水下对接控制中的诸多挑战。通过模拟真实的水下环境,数字孪生系统为控制器的训练提供了丰富的数据支持,而深度强化学习算法则能够根据这些数据不断优化控制策略,提高系统的适应性和精度。这种结合不仅提高了AUV的自主性,还为未来的水下机器人应用提供了新的方向。
在实际应用中,数字孪生系统能够为AUV的开发和测试提供一个安全、高效的虚拟环境,避免了现实实验中的高成本和高风险。同时,深度强化学习算法能够通过不断学习和优化,提高AUV在复杂环境中的适应能力和自主性。本研究提出的系统不仅在理论上具有创新性,而且在实践中得到了验证,证明了其在水下对接任务中的有效性。
本研究的成果表明,数字孪生和深度强化学习的结合能够有效解决水下对接控制中的诸多挑战。通过模拟真实的水下环境,数字孪生系统为控制器的训练提供了丰富的数据支持,而深度强化学习算法则能够根据这些数据不断优化控制策略,提高系统的适应性和精度。这种结合不仅提高了AUV的自主性,还为未来的水下机器人应用提供了新的方向。
本研究的成果表明,数字孪生和深度强化学习的结合能够有效解决水下对接控制中的诸多挑战。通过模拟真实的水下环境,数字孪生系统为控制器的训练提供了丰富的数据支持,而深度强化学习算法则能够根据这些数据不断优化控制策略,提高系统的适应性和精度。这种结合不仅提高了AUV的自主性,还为未来的水下机器人应用提供了新的方向。
本研究的成果表明,数字孪生和深度强化学习的结合能够有效解决水下对接控制中的诸多挑战。通过模拟真实的水下环境,数字孪生系统为控制器的训练提供了丰富的数据支持,而深度强化学习算法则能够根据这些数据不断优化控制策略,提高系统的适应性和精度。这种结合不仅提高了AUV的自主性,还为未来的水下机器人应用提供了新的方向。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号