编辑推荐:
针对水平面上大变形刚柔耦合机械臂(RFCRMs)输入非对称死区及振动控制难题,研究人员提出基于模糊非对称死区补偿(FNDC)的规定时间自适应强化学习控制策略,结合虚拟鲁棒线性二次状态反馈(RLQSF),有效降低跟踪误差与振动,为 RFCRMs 控制提供新方案。
在工业自动化与高端装备领域,刚柔耦合机械臂(RFCRMs)凭借轻量化与高灵活性优势备受青睐,但其柔性结构在大变形下易引发显著振动,且执行器普遍存在的非对称输入死区问题会导致控制精度下降、系统稳定性恶化。传统控制方法在处理强耦合动力学、未知非线性及有限时间收敛需求时面临瓶颈,如何实现大变形工况下的快速精准控制成为亟待突破的技术难点。
为攻克上述挑战,国内研究团队开展了针对水平面上大变形 RFCRMs 的控制策略研究。研究成果发表于《Engineering Applications of Artificial Intelligence》,旨在解决非对称输入死区与复杂动力学耦合带来的跟踪误差和振动抑制难题,为航空航天、精密制造等场景中柔性机械臂的工程应用提供理论支撑。
研究采用的关键技术方法包括:基于虚拟功原理的动力学建模,构建考虑大变形的 RFCRMs 动态方程;设计模糊非对称死区补偿(FNDC)机制,结合规定时间自适应强化学习(PTARLC)算法,实现对未知非线性的在线补偿;引入虚拟鲁棒线性二次状态反馈(RLQSF)输入,解耦系统状态间的强耦合关系,同步抑制振动与跟踪误差;利用李雅普诺夫稳定性理论证明跟踪误差与振动模态收敛至紧凑集合。
动力学建模与控制目标
研究建立了水平面上含大变形柔性梁的 RFCRMs 动力学模型,其由刚性臂杆与柔性梁通过电机驱动耦合而成。模型采用虚拟功原理推导,充分考虑柔性梁的时空变形变量 y (t,s) 与刚性运动的耦合作用,突破了传统小变形假设的局限性,揭示了大变形下系统的欠驱动特性,即部分柔性振动模态无法直接通过执行器控制,为后续控制策略设计奠定基础。
控制策略设计
提出模糊非对称死区补偿规定时间自适应强化学习控制策略(FNDC-RLPTC),其核心包括:
- 模糊死区补偿:通过 Actor 模糊学习律在线估计非对称死区特性,将其视为集总不确定性进行补偿,提升系统对输入非线性的鲁棒性。
- 规定时间收敛:引入柔性规定函数与误差变换函数,结合正切障碍函数,确保跟踪误差在预设时间 T?=T?=13 内收敛至指定精度,解决了传统有限时间控制中收敛时间依赖设计参数的问题。
- 虚拟 RLQSF 输入:生成混合目标轨迹 θ?(t),解耦欠驱动系统的非线性耦合,实现振动抑制与轨迹跟踪的协同控制,避免了传统双控制律设计的复杂性。
数值仿真验证
仿真采用参数:R=diag {0.3,0.3},Q=diag {8,6,20,20,3,4,15,15},规定时间参数 ρ?=0.5、ρ?=2.3,初始位置 α(0)=β?(0)=0,目标轨迹为 α_d=0.4 (1?cos (0.2t))+0.03 与 β?_d=0.6cos (0.2t)。结果表明,与无虚拟 RLQSF 和反步控制基线相比,FNDC-RLPTC 策略显著降低平均角跟踪误差与柔性振动,验证了其在预设时间内的控制有效性与鲁棒性。
研究结论表明,所提出的 FNDC-RLPTC 策略成功解决了大变形 RFCRMs 的非对称死区补偿、振动抑制与快速跟踪控制问题,通过规定时间收敛特性与模糊强化学习的结合,为欠驱动柔性机械系统提供了一种高精度、强鲁棒的控制方案。该成果不仅拓展了刚柔耦合系统的控制理论,也为实际工程中柔性机械臂的控制器设计提供了可借鉴的技术路径,尤其在需要严格时间约束的自动化任务中具有显著应用潜力。未来研究可进一步探索该策略在三维空间多柔性体系统中的扩展应用,以及与视觉伺服等感知技术的融合,提升复杂环境下的自主控制能力。