
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多动作深度强化学习框架的港口船舶调度与拖船组分配协同优化研究
【字体: 大 中 小 】 时间:2025年05月26日 来源:Engineering Applications of Artificial Intelligence 7.5
编辑推荐:
推荐 为解决港口船舶调度与拖船组分配效率低、成本高的问题,研究人员开展了协同优化问题(VT - COP)的研究。通过提出一种端到端的深度强化学习框架,集成图神经网络,显著提升了解决方案质量和计算效率,对现代港口运营具有重要意义。
论文解读
在当今全球化的时代,海运贸易持续蓬勃发展,港口作为货物运输的重要枢纽,其运营效率直接影响着全球经济的运转。然而,随着船舶数量的不断增加,港口面临着诸多挑战。一方面,船舶进出港需要拖船组的协助,以确保安全和及时的通行;另一方面,船舶调度决定了拖船组的需求和时间安排。这两个环节紧密相连,却又相互制约,如何实现它们的协同优化成为了港口运营管理中的关键问题。
传统的解决方法往往将船舶调度和拖船组分配分开处理,忽略了它们之间的协同效应,导致解决方案不够理想。为了突破这一困境,国内的研究人员开展了针对港口船舶调度与拖船组分配协同优化问题(VT - COP)的研究。他们创新性地引入了一个端到端的深度强化学习框架,并集成了图神经网络,旨在自主学习和优化解决 VT - COP 的策略。
在这个框架中,强化学习智能体在每个时间步同时控制多个动作,将每个船舶操作分配到一组可用选项中的合适拖船组。为了解决这个问题的多动作特性,研究人员将其建模为多马尔可夫决策过程(MMDP)。为此,他们引入了新颖的多指针图网络(MPGN)架构和双向近端策略优化(bi - PPO)算法。MPGN 架构包含两个编码器 - 解码器模块,分别独立定义船舶操作和拖船组的动作策略,预测不同船舶操作和拖船组的概率分布。VT - COP 被建模为一个析取图,并利用图神经网络在调度过程中动态嵌入局部状态。
研究人员通过计算实验来评估该框架的有效性。实验结果表明,与启发式算法相比,他们的方法在解决方案质量上显著提高,并且学习到的策略在不同实例中具有良好的泛化能力。此外,在真实世界场景中的测试也证实了该协同优化方法能够满足现代港口的运营效率要求。通过实现更准确和动态的调度决策,这项研究有望减少延误,优化资源利用,并提高港口活动的整体吞吐量,在现代高需求的港口环境中具有显著优势。
该研究的主要技术方法包括多马尔可夫决策过程(MMDP)建模、多指针图网络(MPGN)架构设计和双向近端策略优化(bi - PPO)算法开发。MMDP 用于对 VT - COP 进行建模,定义状态、动作和奖励以解决问题。MPGN 架构由两个编码器 - 解码器模块组成,分别独立定义船舶操作和拖船组的动作策略。bi - PPO 算法则用于在训练阶段学习两个子策略,即船舶操作动作策略和拖船组动作策略。
研究结果显示,该框架在随机生成的实例和真实世界的海港场景中均表现出色。在计算实验中,框架在包含 8800 个随机生成的 VT - COP 实例的训练集上进行训练,在包含 88 个随机生成的实例的验证集和测试集上进行评估。例如,在一个 n*m = 3 * 3 的 VT - COP 实例中,展示了拖船组对每个操作的服务时间。实验结果表明,与启发式算法相比,该框架在解决方案质量上有显著提升,并且学习到的策略具有良好的泛化能力。
研究结论强调了该研究的重要意义。通过将 VT - COP 建模为多马尔可夫决策过程,并设计 MPGN 结合 bi - PPO 算法,研究人员在解决方案质量和计算效率方面取得了显著进展。这项研究不仅解决了船舶调度和拖船组分配中的协同优化问题,还为现代港口的高效运营提供了新的思路和方法。此外,该框架可以直接应用于各种 VT - COP 场景,无需预先对环境进行建模,具有很强的实用性和推广价值。随着全球贸易的不断增长和港口运营的日益复杂,这项研究有望为港口行业的发展带来新的机遇和挑战,推动港口向更加智能化、高效化的方向发展。
生物通微信公众号
知名企业招聘