基于数字孪生与深度强化学习的太阳能电池车间AGV集群动态调度方法研究

【字体: 时间:2025年06月16日 来源:Neurocomputing 5.5

编辑推荐:

  为解决太阳能电池生产车间中大规模AGV(自动导引车)集群因高动态性、复杂性和不确定性导致的传统调度方法失效问题,同济大学团队提出了一种融合数字孪生(DT)与深度强化学习(DRL)的动态调度框架。研究通过构建虚拟-现实交互系统、建立最小化平均等待时间的数学模型,并改进Soft Actor-Critic(ISAC)算法,实现了AGV集群的高效调度。实际案例验证表明,该方法较传统规则算法和元启发式优化算法分别降低平均等待时间15.88%和34.44%,为智能制造提供了创新解决方案。

  

在全球能源转型背景下,太阳能电池作为光伏发电的核心组件,其生产规模正呈指数级增长。然而,这类车间面临着一个鲜为人知的挑战:超过400台自动导引车(AGV)组成的庞大运输集群,在高达15.6%的碎片率、1.67次平均对接尝试失败率等扰动因素下,传统调度方法完全失灵。更棘手的是,车间内900多台设备产生的实时数据洪流,使得基于混合整数规划(MIP)的优化算法因计算耗时过长而失去实用价值。这种"规模大、动态强、扰动多"的三重困境,导致太阳能电池生产成本居高不下,成为制约产业发展的隐形瓶颈。

针对这一难题,同济大学的研究团队在《Neurocomputing》发表了一项突破性研究。该团队创造性地将数字孪生(Digital Twin, DT)技术与深度强化学习(Deep Reinforcement Learning, DRL)相结合,构建了全新的AGV集群动态调度体系。研究首先建立了虚实映射的DT框架,实现物理车间与虚拟模型的毫秒级同步;随后设计包含5种调度规则的马尔可夫决策过程(MDP)模型;最终改进Soft Actor-Critic算法,通过引入Softmax函数和多阶段样本选择策略,解决了传统DRL训练收敛慢的痛点。

关键技术方法包括:1)基于实际车间数据的数字孪生系统构建;2)以最小化平均等待时间为目标的AGV调度数学模型;3)改进型ISAC算法设计,重点优化了策略网络的探索能力;4)6个真实生产案例的对比验证。所有实验数据均来自产能超300万片/日的实际生产线。

【DT-based AGV集群动态调度框架】
研究构建了包含"虚拟-现实交互"、"决策模型训练"和"在线应用"的三层架构。通过实时采集AGV状态、缓冲区位姿等300+维度数据,在虚拟空间中创建了可并行训练的"数字镜像",使DRL模型能在零风险环境下完成预训练。

【AGV集群调度数学模型】
创新性地将运输时间不确定性量化为概率分布,建立多目标优化模型。其中缓冲区的容量约束Jg
、碎片率参数P等15个关键变量被精确建模,为后续DRL学习奠定基础。

【改进型ISAC算法】
在传统SAC算法基础上做出两项改进:1)策略网络输出层采用Softmax函数替代Tanh,有效解决动作空间维度灾难;2)设计基于时序优先级的样本回放机制,使关键样本利用率提升37%。

【案例验证】
在丝网印刷等6个典型工段的测试中,ISAC方案展现出显著优势:与最短加工时间优先(SPT)规则相比,平均等待时间降低15.88%;较遗传算法(GA)提升34.44%。特别在AGV故障突发的极端场景下,系统恢复时间缩短62%。

该研究的核心价值在于首次实现了DRL在超大规模AGV集群中的实用化部署。通过数字孪生技术构建的"预训练-微调"范式,解决了DRL在真实场景中试错成本高的根本性难题。研究提出的多阶段样本选择策略,为复杂工业场景下的样本效率问题提供了新思路。实际应用数据显示,该方法可使太阳能电池单日产能提升8.2%,年化经济效益超千万元。这些突破不仅为光伏制造业提供了标杆解决方案,其方法论对半导体、锂电等精密制造领域同样具有重要借鉴意义。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号