基于在线强化学习策略的人工蜂群算法,用于解决具有序列依赖性准备时间的双目标分布式回流车间调度问题
《Expert Systems with Applications》:Online reinforcement learning strategies driven artificial bee colony algorithm for bi-objective distributed reentrant flowshops scheduling problem with sequence-sependent setup time
【字体:
大
中
小
】
时间:2025年09月19日
来源:Expert Systems with Applications 7.5
编辑推荐:
本文针对分布式再入流车间调度问题(DRFSP-SDST),提出融合人工蜂群算法与强化学习的优化方法,设计六种局部搜索算子和两种速度调整策略,同时最小化总能耗和最大完成时间,并通过36个基准实例验证了算法的有效性和优越性。
在当前制造业快速发展的背景下,生产系统的复杂性不断上升,这促使了分布式再入流水车间调度问题(DRFSP-SDST)的研究日益受到重视。该问题不仅涉及到多个工厂之间的任务分配与调度,还引入了再入(reentrancy)和顺序依赖设置时间(SDST)两个关键因素,使得问题在实际应用中更加复杂和具有挑战性。再入特性意味着某些任务可能需要在不同的阶段重复经过相同的机器或工厂,这种非线性路径的引入显著增加了调度的难度。而顺序依赖设置时间则表明,在任务切换过程中,设置时间会受到前后任务类型的影响,这进一步增加了问题的不确定性。为了应对这些挑战,本文提出了一种结合人工蜂群算法(ABC)和强化学习(RL)策略的优化方法,旨在实现最小化总能耗(TEC)和最大完成时间(makespan)的双重目标。
随着智能制造技术的不断进步,制造业正经历从集中式生产向分布式协同制造的深刻变革。这一转型不仅提高了生产系统的灵活性和响应速度,也带来了更高的调度复杂性。分布式流水车间调度问题(DFSP)作为传统流水车间调度问题(FSP)的扩展,广泛应用于化工加工、电子组装和汽车制造等多个行业。DFSP的核心在于如何在多个独立但相互关联的车间中合理分配任务,同时优化全局性能指标并应对动态干扰带来的不确定性。然而,现有的调度方法在动态适应性、多目标协同优化以及大规模问题的计算效率方面仍存在不足,这促使了研究者探索更稳健和实时的调度策略。
为了进一步提升调度的复杂性,DRFSP-SDST作为DFSP的一个更复杂变种,不仅需要考虑任务分配和调度,还必须处理再入特性以及顺序依赖设置时间的影响。这些因素使得问题的求解变得更加困难,因为它们打破了传统流水车间调度中任务单向流动的假设。在实际生产中,再入特性常出现在需要多步骤处理的流程中,例如半导体制造中的晶圆需要在光刻设备上多次进行处理。因此,DRFSP-SDST的解决对于提升复杂制造系统的效率、降低运营成本以及优化资源利用具有重要意义。
能源消耗已成为分布式流水车间调度问题中的一个关键考量因素,特别是在现代制造业中,能源成本和环境可持续性已成为企业决策的重要依据。在分布式生产环境中,任务需要在多个车间之间进行分配和调度,而机器的分布特性使得能源管理变得更加复杂。如何在保证生产效率的同时降低能源消耗,成为当前研究的一个重要方向。通过采用精确算法、启发式方法和多目标优化技术,可以找到在高度复杂环境中平衡运营表现与能源节约的可行调度方案。这一研究方向对于推动绿色制造和实现可持续工业发展具有重要的现实意义。
为了应对DRFSP-SDST的复杂性,本文提出了一种基于人工蜂群算法的改进方法。人工蜂群算法是一种模拟蜜蜂群体觅食行为的智能优化算法,它通过模拟蜜蜂的侦察、雇佣和观察行为来寻找最优解。该算法在解决多目标和动态优化问题方面表现出较强的适应能力。在本文中,为了提升算法的性能,研究者特别设计了六种局部搜索算子,并将其集成到人工蜂群算法中。这些算子基于实际生产环境的特点,旨在优化调度策略并减少计算时间。此外,为了进一步提升调度的智能化水平,本文还引入了两种强化学习策略——Q学习和SARSA算法,作为在线学习策略,用于指导算法在迭代过程中选择高质量的局部搜索策略。
强化学习是一种基于试错机制的机器学习方法,它允许智能体通过与环境互动来学习如何做出最优决策。Q学习和SARSA是两种经典的强化学习算法,它们在解决需要序列决策的问题上表现出色。在本文中,这两种算法被用于辅助人工蜂群算法的迭代过程,通过动态调整局部搜索策略,提高算法在处理复杂调度问题时的适应性和效率。研究者为每种强化学习算法设计了两种不同的局部搜索策略选择方式,使得算法能够在不同的问题环境下灵活应对。这种结合强化学习与人工蜂群算法的方法,不仅提高了算法的性能,也为解决复杂的多目标调度问题提供了新的思路。
为了验证所提出方法的有效性,本文在36个不同规模的基准实例上进行了全面的数值实验。这些实例基于Taillard(1993)提出的基准数据集,涵盖了小规模、中规模和大规模三种情况。在实验中,研究者对算法的参数进行了调优,并通过统计分析方法对实验结果进行了评估。此外,为了进一步验证算法的优越性,研究者还采用了Friedman检验方法,这是一种用于多组数据比较的非参数检验方法,能够有效评估不同算法在多个指标上的表现。实验结果表明,基于SARSA的局部搜索策略优化后的人工蜂群算法在解决DRFSP-SDST问题时表现出更强的竞争力。
本文的研究成果不仅为分布式再入流水车间调度问题提供了有效的解决方案,也为制造业的绿色转型和可持续发展提供了理论支持。通过结合人工蜂群算法和强化学习策略,研究者成功地在多目标优化和动态适应性方面取得了突破。这种方法能够根据问题的具体情况自动调整局部搜索策略,从而在不同规模和复杂度的任务环境中实现更优的调度效果。此外,研究者还提出了一种基于问题解决过程特性的节能策略,进一步降低了生产过程中的能源消耗,为实现低碳制造提供了新的思路。
在实际应用中,DRFSP-SDST的解决对于提升制造系统的整体效率至关重要。传统的调度方法往往无法有效应对再入特性和顺序依赖设置时间带来的挑战,而本文提出的方法则通过引入智能优化算法和强化学习策略,克服了这些限制。此外,本文还探讨了多种可能的扩展方向,例如如何在实际生产环境中应用这些策略,以及如何进一步优化算法的性能。这些研究不仅有助于提高制造系统的运行效率,也为未来的工业智能化发展提供了重要的参考。
为了确保研究的透明度和科学性,本文作者声明他们没有已知的财务利益或个人关系可能影响本研究的客观性。此外,研究得到了多个科研基金的支持,包括国家自然科学基金、澳门特别行政区科学技术发展基金以及珠海市产业-高校-科研项目等。这些资金的投入为研究提供了必要的资源和保障,使得研究能够在更广泛的范围内进行验证和推广。
综上所述,本文通过构建一个双目标的数学模型,结合人工蜂群算法和强化学习策略,提出了一种新的调度方法,用于解决分布式再入流水车间调度问题。该方法不仅在理论上具有创新性,也在实践中展现出良好的应用前景。通过引入局部搜索算子和在线学习策略,研究者有效提升了算法的适应性和效率,为制造业的绿色转型和智能化发展提供了有力支持。未来的研究可以进一步探索该方法在更大规模和更复杂环境中的应用,以及如何与其他智能优化技术相结合,以实现更全面的调度优化。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号