
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于PPO-HFEN混合特征提取网络的柔性作业车间动态重调度优化研究
【字体: 大 中 小 】 时间:2025年07月22日 来源:Engineering Applications of Artificial Intelligence 7.5
编辑推荐:
本研究针对柔性作业车间动态重调度问题(FJSRP),提出融合多层混合特征提取网络(HFEN)与混合奖励函数(MRF)的PPO-HFEN策略,通过注意力机制优化特征提取与作业优先级分配,在40组实验中21组表现优于现有算法,为智能制造动态调度提供高效解决方案。
在智能制造浪潮下,柔性作业车间调度(FJS)已成为提升企业竞争力的核心技术。然而现实生产中,紧急订单插入、机器故障等动态事件常使既定调度计划失效,将经典柔性作业调度问题(FJSP)升级为更具挑战性的柔性作业重调度问题(FJSRP)。传统方法如启发式规则(PDR)易陷入局部最优,元启发式算法计算耗时,而深度强化学习(DRL)虽具潜力,却面临特征提取不足与多目标优化失衡的瓶颈。
针对这一行业痛点,河北工业大学的Hao Sun团队在《Engineering Applications of Artificial Intelligence》发表创新研究。他们开发了PPO-HFEN策略,核心突破在于:1)构建多层混合特征提取网络(HFEN),通过点积与乘积型注意力机制融合新旧订单特征;2)设计混合奖励函数(MRF)解决训练收敛难题;3)结合近端策略优化(PPO)防止过拟合。关键技术包括:基于历史数据的深度强化学习训练框架、异构图表征车间状态、多目标协同优化算法等。
研究结果部分显示:
Preliminaries
建立包含机器资源约束、作业优先级等要素的FJSRP数学模型,采用异构图网络表征工序竞争关系。
Proposed method
PPO-HFEN策略通过HFEN网络分层提取机器负载、工序时序等特征,MRF函数平衡完工时间(makespan)与机器利用率权重。实验证明该框架能有效处理订单插入后的资源再分配。
Experimental results
在40组测试案例中,PPO-HFEN在21组表现最优,较MOPNR、SPT等启发式规则提升效率12-18%,比NSGA-II、MOEA/D等元启发式算法缩短计算时间30%以上。实际铸造车间应用验证了策略的工程价值。
Conclusion
该研究首次将混合注意力机制引入动态重调度领域,HFEN网络有效捕捉了新旧订单的竞争特征,MRF函数破解了多目标优化的稀疏奖励难题。相比Li et al. (2025)的多智能体框架,本方案训练效率提升40%,为智能车间动态调度提供了可扩展的新范式。未来研究可拓展至AGV物流协同调度等更复杂场景。
这项获得国家重点研发计划(2022YFB3705504)支持的工作,不仅解决了电子制造、定制家具等行业紧急订单插入的痛点,其提出的HFEN-MRF架构更为DRL在工业调度中的应用提供了普适性框架。正如作者团队所述,该成果标志着智能制造从"静态优化"迈向"动态博弈"的重要一步。
生物通微信公众号
知名企业招聘