基于多目标双Q学习的超启发式算法在铝生产运输集成调度问题中的应用研究

【字体: 时间:2025年09月08日 来源:Engineering Applications of Artificial Intelligence 8

编辑推荐:

  本文提出了一种创新的多目标双Q学习超启发式算法(MDQHH),用于解决电解铝生产与铝液配送协同过程中的集成调度问题(APTISP)。该研究构建了以总完工时间(TCT)和总能耗(TEC)为优化目标的数学模型,通过动态调整ε-贪婪策略和9种定制化底层扰动启发式(LLPHs),实现了分布式阻塞流水车间(DBFSP)与带容量车辆路径问题(CVRP)的联合优化。算法采用双Q表交替更新机制,显著提升了复杂约束下的调度效率。

  

Highlight亮点

本研究针对铝工业中电解铝生产与铝液配送的强耦合问题(APTISP),开发了融合双Q学习(Double Q-learning)的超启发式算法(MDQHH)。该算法通过动态ε-贪婪策略平衡探索与开发,创新性地采用双Q表交替更新机制,有效解决了传统方法在分布式阻塞流水车间(DBFSP)和带容量车辆路径问题(CVRP)联合优化中的过估计问题。

Problem Description问题描述

APTISP包含两个关键阶段:

1)生产阶段:采用分布式阻塞流水车间(DBFSP)模型,n个工件在F个工厂的m台机器上加工,无中间缓冲区导致阻塞现象;

2)配送阶段:通过容量受限车辆(CVRP)将液态铝运送至下游企业。研究同步优化总完工时间(TCT)和总能耗(TEC),其NP-hard特性使传统精确算法难以应对。

Solution Representation解决方案表征

算法采用三维编码结构:

  • 工厂生产序列λ={λ1,...,λF}

  • 工件分配矩阵

  • 车辆配送路径

    通过9种定制化底层扰动启发式(LLPHs)在解空间进行智能搜索,包括机器负载均衡和路径优化算子。

Experimental Results实验结果

在12代Intel Core处理器平台验证显示,MDQHH在50-200规模算例中:

  • TCT平均降低18.7%

  • TEC优化达22.3%

    显著优于NSGA-II、MOEA/D等对比算法,且ε值动态衰减策略使收敛速度提升35%。

Conclusions结论

MDQHH算法通过双Q学习框架和问题导向的启发式设计,为铝工业智能制造提供了新型调度范式。未来将拓展至多温度区铝液运输等复杂场景。

(注:根据要求已去除文献引用标识[1][2]和Fig.1等图示标注,数学符号采用/标签规范化表示)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号