
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多目标双Q学习的超启发式算法在铝生产运输集成调度问题中的应用研究
【字体: 大 中 小 】 时间:2025年09月08日 来源:Engineering Applications of Artificial Intelligence 8
编辑推荐:
本文提出了一种创新的多目标双Q学习超启发式算法(MDQHH),用于解决电解铝生产与铝液配送协同过程中的集成调度问题(APTISP)。该研究构建了以总完工时间(TCT)和总能耗(TEC)为优化目标的数学模型,通过动态调整ε-贪婪策略和9种定制化底层扰动启发式(LLPHs),实现了分布式阻塞流水车间(DBFSP)与带容量车辆路径问题(CVRP)的联合优化。算法采用双Q表交替更新机制,显著提升了复杂约束下的调度效率。
Highlight亮点
本研究针对铝工业中电解铝生产与铝液配送的强耦合问题(APTISP),开发了融合双Q学习(Double Q-learning)的超启发式算法(MDQHH)。该算法通过动态ε-贪婪策略平衡探索与开发,创新性地采用双Q表交替更新机制,有效解决了传统方法在分布式阻塞流水车间(DBFSP)和带容量车辆路径问题(CVRP)联合优化中的过估计问题。
Problem Description问题描述
APTISP包含两个关键阶段:
1)生产阶段:采用分布式阻塞流水车间(DBFSP)模型,n个工件在F个工厂的m台机器上加工,无中间缓冲区导致阻塞现象;
2)配送阶段:通过容量受限车辆(CVRP)将液态铝运送至下游企业。研究同步优化总完工时间(TCT)和总能耗(TEC),其NP-hard特性使传统精确算法难以应对。
Solution Representation解决方案表征
算法采用三维编码结构:
工厂生产序列λ={λ1,...,λF}
工件分配矩阵
车辆配送路径
通过9种定制化底层扰动启发式(LLPHs)在解空间进行智能搜索,包括机器负载均衡和路径优化算子。
Experimental Results实验结果
在12代Intel Core处理器平台验证显示,MDQHH在50-200规模算例中:
TCT平均降低18.7%
TEC优化达22.3%
显著优于NSGA-II、MOEA/D等对比算法,且ε值动态衰减策略使收敛速度提升35%。
Conclusions结论
MDQHH算法通过双Q学习框架和问题导向的启发式设计,为铝工业智能制造提供了新型调度范式。未来将拓展至多温度区铝液运输等复杂场景。
(注:根据要求已去除文献引用标识[1][2]和Fig.1等图示标注,数学符号采用/标签规范化表示)
生物通微信公众号
知名企业招聘