一种基于仿真的方法,用于利用质量多样性算法在数据稀疏的情况下重构多样化的供应链模型

《Simulation Modelling Practice and Theory》:A simulation-based approach for reconstructing a diverse set of supply chain models with sparse data using a quality diversity algorithm

【字体: 时间:2025年10月31日 来源:Simulation Modelling Practice and Theory 4.6

编辑推荐:

  本研究评估质量多样性(QD)算法在生成含数据稀疏性的供应链模拟模型多样性集方面的可行性。通过 counterfeit PPE案例,发现QD在低稀疏数据下能有效识别真实结构,但数据稀疏性增加时易过拟合,生成复杂结构模型。算法成功生成多样化的高适配模型,但需优化校准指标以减少过拟合风险。

  在当前的研究中,我们探讨了在数据稀疏的情况下,使用质量多样性(Quality Diversity, QD)算法生成多样化的供应链模拟模型的可行性。由于供应链中的参与者往往不愿意分享他们的数据,这种数据稀疏性使得模拟建模变得困难,进而导致模拟模型在参数和结构上存在不确定性。研究结果显示,QD算法能够生成一组多样化的供应链模拟模型,其中包括真实情况。然而,随着数据稀疏性的增加,QD算法可能会出现过拟合的现象,即识别出比真实结构更复杂的供应链结构。

在2020年新冠疫情爆发期间,对个人防护装备(PPE)的需求急剧上升,这不仅包括护目镜、手套、口罩和呼吸器等产品,也催生了非法市场对假冒PPE的生产和分发。非法组织通过销售非医用PPE作为医用PPE来获取高额利润,从而带来了不可接受的健康风险。由于缺乏历史数据以及非法活动者试图尽可能掩盖他们的数据,这些非法组织的活动及其相关的物流大多不可见,给执法部门有效干预、查获假冒PPE和阻止犯罪带来了挑战。

模拟作为一种理解系统和测量系统变化效果的方法,通常通过建模系统行为随时间的变化来实现。本文专注于使用离散事件模拟模型来代表非法供应链。离散事件模拟模型包括组件、它们的参数以及组件之间的关系。例如,一个供应链的模拟模型由参与者组成,参与者具有如产品处理时间、库存水平和运输时间等参数。这些关系则定义了供应链的结构,即参与者之间的连接方式。校准使用数据来调整模拟模型的参数,使模型的行为能够与现实世界的行为相符。

供应链数据,如需求、库存水平、处理时间和运输时间,通常由于供应链参与者不愿分享他们的正确数据而变得稀疏。这种不愿分享的原因多种多样,包括竞争、高昂的数据成本或非法供应链中的欺诈行为。当数据稀疏时,校准过程中出现等效最终性的概率增加,即多个版本的供应链模拟模型能够正确再现稀疏观测到的数据。因此,一个具有稀疏数据的系统无法被单一理论或模型完全解释,而需要一组多样化的模型。这一观点与Page提出的多模型思维方法相一致,强调需要多个模型来理解和分析复杂系统。

然而,基于稀疏数据创建一个有用的模型集合并不容易。许多可以生成多个模型配置的校准算法往往收敛到相似的解决方案,因为那些与最佳匹配解决方案参数略有不同的配置通常优于参数差异较大的配置。因此,在校准过程中找到一组多样化的解决方案,如20个,比找到前20个最佳解决方案更具挑战性,但多样化的解决方案更具吸引力。

一种生成多样模型的方法是使用质量多样性算法。质量多样性算法基于进化概念,旨在在用户定义的搜索空间中找到多个最优解。这些算法在机器人和强化学习领域已有应用,近年来也扩展到多目标优化、机器学习模型的超参数调整以及识别决策者最偏好的解决方案。然而,质量多样性算法在许多其他应用领域仍处于探索阶段,因为它是一种相对较新的进化计算方法。

在本研究中,我们使用了一个质量多样性算法——Covariance Matrix Adaptation MAP-Elites(CMA-ME),它结合了流行的MAP-Elites算法和一个单目标优化算法——Covariance Matrix Adaptation Evolution Strategy(CMA-ES)。这种混合算法利用MAP-Elites高效地探索搜索空间的新区域,同时利用CMA-ES的选型和适应规则找到高质量的解决方案。通过使用CMA-ME,我们能够评估其在不同数据稀疏程度下生成多样化的供应链模拟模型的能力。

我们构建了一个合成的非法PPE供应链模型作为真实情况,并从该模型中提取数据,用于模拟。我们通过改变数据稀疏性的程度,测试QD算法能否生成与真实情况一致的模型。通过比较不同数据稀疏性场景下模型的拟合效果,我们发现QD算法在数据稀疏性较低的情况下,能够更频繁地识别真实结构。然而,当数据稀疏性增加时,QD算法倾向于生成比真实结构更复杂的模型,这可能意味着过拟合的风险。

在分析结果时,我们发现QD算法在生成多样化模型方面表现出色,尤其是在处理稀疏数据时。通过比较不同种子(seeds)生成的模型,我们发现某些种子能够更有效地识别真实结构,而其他种子则需要更多的迭代才能达到满意的拟合程度。这表明QD算法对种子的初始化非常敏感,因此在实际应用中,使用多个种子对于提高模型的多样性和质量至关重要。

此外,我们还评估了QD算法在处理不同特征配置(feature profiles)时的表现。结果显示,对于某些特征配置,如结构和模式,QD算法能够识别出真实结构,但在其他配置中,如来源和目的地,真实结构的识别频率较低。这表明QD算法在某些方面可能比其他方面更有效,同时也揭示了模型校准过程中参数和结构之间的相互作用。

尽管QD算法在生成多样化模型方面表现出色,但其在处理高维参数空间时仍存在一些限制。例如,QD算法无法保证在离散化的行为空间中填满所有容器,这可能意味着某些行为特征无法被有效探索。此外,当数据稀疏性增加时,算法可能会生成更多复杂的模型,这可能导致过拟合的风险,即模型可能更准确地拟合稀疏数据,但可能无法准确反映真实系统的结构。

总的来说,本研究展示了质量多样性算法在处理稀疏数据时生成多样化供应链模拟模型的潜力。通过使用合成的真实情况模型,我们验证了QD算法在不同数据稀疏性场景下的表现,并发现其在数据稀疏性较低时更有效,而在数据稀疏性较高时可能需要更多的迭代来达到满意的结果。尽管存在一些限制,QD算法为处理稀疏数据和不确定性提供了新的视角,使得决策者能够基于多个模型做出更稳健的决策。

未来的研究可以进一步探索QD算法在其他系统中的应用,以及如何通过增加行为空间的维度来提高模型的多样性和可解释性。此外,研究可以关注如何优化校准指标,以减少复杂网络结构的过拟合现象。这些研究方向将有助于更好地理解和应用质量多样性算法,为供应链建模和其他复杂系统分析提供更有效的工具。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号