
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于异构图注意力增强深度强化学习的可变子批次柔性作业车间调度方法研究
【字体: 大 中 小 】 时间:2025年06月11日 来源:Engineering Applications of Artificial Intelligence 7.5
编辑推荐:
针对可变子批次柔性作业车间调度问题(FJSP-VS)中组合爆炸、时序依赖和动态平衡三大挑战,研究团队提出了一种基于异构图注意力机制(HGADRL)的深度强化学习框架。该方法通过双尺度图注意力网络(HDGAT)精准捕捉异构顶点间复杂依赖关系,在500组合成实例和16组未见规模实例中均优于12种混合优先级调度规则和元启发式算法,显著提升了求解效率与泛化能力,为智能制造实时决策提供了新范式。
在个性化定制需求激增的制造业背景下,多规格小批量生产模式导致订单密度骤增。传统柔性作业车间调度问题(Flexible Job Shop Scheduling Problem, FJSP)面临全新挑战——如何通过可变子批次(Variable Sublots)技术提升设备利用率。将工序拆分为数量与尺寸均可变的子批次虽能减少空闲时间,却带来组合爆炸(n×s×ms
级行动空间)、时序依赖(前序工序微小延迟引发系统性瓶颈)和动态平衡(子批次数量与换模频次的矛盾)三大NP-hard难题。现有元启发式算法如灰狼优化器(GWO)和人工蜂群算法(ABC)计算耗时过长,而优先级调度规则(PDRs)则严重依赖专家经验且解质量有限。
为此,华中科技大学研究团队在《Engineering Applications of Artificial Intelligence》发表研究,提出异构图注意力增强深度强化学习框架(HGADRL)。该方法创新性地构建异构析取图(HDG)表征动态调度状态,开发双尺度图注意力网络(HDGAT)捕捉工序-子批次-机器间的复杂关联,结合演员-评论家网络实现端到端决策。在500组合成实例测试中,HGADRL最大完工时间Cmax
指标全面超越12种混合PDRs和元启发式算法,并在16组未见规模实例中展现出卓越泛化能力。
关键技术包括:1) 构建含工序节点、子批次节点和机器节点的异构析取图;2) 设计含局部-全局双模块的HDGAT网络,通过注意力机制量化异构顶点关联;3) 建立马尔可夫决策过程(MDP)模型统一决策工序选择与子批次划分;4) 采用演员-评论家框架进行策略优化。
问题描述与建模
研究将FJSP-VS定义为包含p台机器和n类工件的系统,每工件含q道工序。通过改进析取图引入子批次节点,构建包含工序选择、子批次划分和机器分配的三元组决策空间。
方法论创新
HDGAT网络采用双尺度注意力机制:局部模块聚焦工序-子批次关联,全局模块捕捉跨工序依赖。通过异构图嵌入将离散调度状态转化为连续向量,解决传统Q-table维度灾难问题。
实验结果
在450-550个工序的大规模实例中,HGADRL较最优对比算法平均降低Cmax
达12.7%。计算效率方面,单个实例平均决策耗时仅0.38秒,较遗传算法提速两个数量级。
结论与展望
该研究首次实现DRL在可变子批次调度中的多目标协同优化,其核心突破在于:1) 通过图注意力机制显式建模工序分割与设备分配的耦合关系;2) 建立可扩展的异构状态表示框架。未来研究可探索多目标优化场景,并将方法拓展至动态扰动环境下的实时调度。
生物通微信公众号
知名企业招聘