基于因子分解机的功能材料主动学习设计:最优初始数据策略与收敛性分析

【字体: 时间:2025年09月21日 来源:Advanced Intelligent Discovery

编辑推荐:

  本综述系统探讨了基于因子分解机(FM)的主动学习算法在功能材料优化设计中的应用。研究通过平均分段线性回归技术,确定了不同设计空间规模下实现高效收敛所需的最优初始数据量,揭示了充足初始数据对提升量子兼容优化效率、降低计算成本的关键作用。工作为大规模组合优化问题提供了重要的初始化策略指导,推动了量子计算增强的材料设计范式发展。

  

引言

功能材料的最优设计对于增强其性能特性变得日益重要,然而材料固有的复杂几何特征显著扩大了设计空间,给优化过程带来巨大挑战。探索如此庞大的设计空间在实验和计算上都十分昂贵,因此研究者提出了多种优化算法来应对这些挑战,包括神经网络、贝叶斯优化、遗传算法和黑盒模型等数据驱动方法。这些算法致力于从可用数据中学习材料结构与其相应性能指标之间的内在关系和模式,通过做出知情决策来实现高性能功能材料的设计。

基于代理模型的主动学习方法通过迭代构建代理模型,并在决策过程后将更高质量的数据点添加到先前数据集中,近年来在数据驱动材料设计领域引起广泛关注。与传统代理建模方法相比,因子分解机将代理模型表述为二次无约束二进制优化问题,与量子计算技术(包括量子退火和量子近似优化算法)具有直接兼容性。这种量子兼容的表述使得能够优化具有数百个设计变量的问题,这一规模对经典方法而言难以处理,但对量子增强优化仍然可行。

因子分解机基础

因子分解机是一种监督学习算法,通过学习输入向量x与其相应输出值y之间的关系来工作。其核心方程包含了全局偏置、线性系数和二次系数等模型参数。这些参数可用于构建表述为QUBO哈密顿量的代理模型,描述材料结构与相应品质因数之间的关系。

采用因子分解机于主动学习算法的优势包括训练速度快、能够捕捉稀疏数据集中的复杂关系,以及利用量子计算处理源自FM模型参数的代理模型。量子计算机接收QUBO形式的代理模型来评估能量景观,并返回具有基态的二进制向量。量子退火器通常用于此任务,通过量子绝热过程在识别基态方面显示出巨大潜力。

FM模型参数可以直接拟合到QUBO模型,其中QUBO中的线性和二次项分别对应于FM模型的线性和交互系数。因此,FM给出的代理模型可以无缝链接到QUBO,然后通过量子计算来寻找最优状态。

主动学习工作流程

基于FM的主动学习算法通过迭代过程优化功能材料的工作流程包含三个关键组件:首先训练FM以构建代理模型;随后使用FM模型参数制定代理模型,并通过QUBO求解器进行评估以识别给定代理的近似最优状态;最后计算与QUBO求解器预测的近似最优状态相关的功能特性。

该算法迭代地更新其数据集质量,从而允许构建更可靠的代理模型。随后可以识别更高质量的数据点,导致在全局设计空间中识别最优材料结构。

模型准确性验证

为验证FM代理模型的预测性能,研究使用标准回归指标进行了全面评估。结果表明FM在不同问题规模下都表现出优异的预测准确性,当提供足够的训练数据点时,R2分数高于0.93。 parity图和目标函数值分布进一步视觉确认了预测值与实际目标函数值之间的强一致性。这些性能指标证实FM提供了可靠的代理模型预测,适用于指导主动学习优化过程,同时保持了大规模应用所需的量子兼容表述。

功能材料优化案例:透明辐射冷却窗

作为案例研究,该主动学习算法被应用于设计透明辐射冷却窗。辐射冷却技术旨在反射输入热源并通过大气窗口发射热辐射,在过去十年中作为解决全球变暖问题的方案引起了相当多的关注。特别是TRC材料可用于建筑或汽车窗户,这些被认为是冷却效率最低的组件,以最小化能耗。

研究设计了平面多层结构的TRC窗户,每层包含四种材料候选:二氧化硅、氮化硅、氧化铝和二氧化钛,固定总厚度为1200nm。顶部沉积聚二甲基硅氧烷层作为发射层,底部基底为二氧化硅。层数从20到80层不等,每层使用两位二进制标签表示材料选择。理想的TRC窗户应在可见光区域具有统一透射,在紫外和近红外区域具有零透射。

研究方法

收敛性确定

品质因数随着优化周期的推进趋于下降,因为主动学习算法运行良好。为定量分析FOM随优化周期的下降趋势,研究采用FOM-优化周期图。首先通过优化40-160位TRC系统生成数据,起始于不同数量的初始数据。随后在FOM-优化周期图上绘制回归线并计算回归线的梯度。

由于FOM与优化周期通常呈现非线性关系,应采用非线性回归技术。研究使用了3次和5次多项式进行多项式回归,以及5段和100段分段回归。平均分段回归技术采用了五个不同范围的分段回归的平均值,每个分段回归包含20段。当回归线梯度首次达到-3时确定为收敛开始点。

节能计算

使用EnergyPlus版本9.4进行节能计算。考虑了一个标准办公室模型,配备优化TRC窗户或传统玻璃窗户。目标冷却温度设置为24°C,除优化TRC窗户的光学特性外,保持所有其他默认设置。选择了16个美国城市和16个国际城市来计算冷却能耗。

实验结果

FOM收敛分析

分析了不同初始数据量下各种设计空间规模的FOM收敛模式。小型系统不需要大量初始数据,例如40位和60位系统即使从25个初始数据开始也能在500个优化周期内实现收敛。相反,较大系统需要更多初始数据来实现收敛。当从少量初始数据开始时,早期优化周期收集的低质量数据点类似于随机选择点,阻止FOM收敛到最优状态。

为分析确定收敛开始起始点,基于FOM-优化周期图计算回归线梯度。多项式回归技术由于对多项式次数的敏感性,可能不适合分析FOM分布。分段线性回归技术中,分段数量影响回归结果。平均分段线性回归有效捕捉了复杂分布,产生了合理的回归和梯度图。

最优初始数据量

结果显示小型系统不需要大量初始数据,而较大系统分别需要100、200、1000和2000个初始数据以确保在500次迭代内满意收敛。160位系统的设计空间显著较大,因此从25个初始数据开始优化时难以看到清晰的FOM收敛模式。采用足够数量的初始数据对于基于代理的主动学习至关重要,特别是在设计大型系统时。

对于大型系统,采用较小绝对阈值值确定起始点是更合适的策略。结果突出了实现优化过程中高效可靠收敛的最优初始数据量,从而以合理计算成本获得良好优化结果。

优化功能材料

采用此策略设计TRC窗户,60位系统产生了最低FOM。二进制向量表示优化后的TRC窗户结构,该结构表现出所需的光学特性,在可见光区域具有高透射,在紫外和近红外区域具有低透射。由于顶部聚合物层,该窗户在中长波红外区域具有高发射。

因此,设计的TRC窗户的太阳能加权透射与理想情况密切相似,符合优化目标。结果表明设计的TRC具有强大的反射产热光子同时允许可见光透射的能力,表明在建筑或汽车窗户中具有巨大应用潜力。

通过EnergyPlus软件计算各种城市中使用设计TRC窗户或玻璃窗户的场景下的冷却能耗,比较结果显示TRC窗户比传统玻璃窗户需要更少的冷却能耗,显示出巨大的节能潜力。特别是在热带气候中表现出优异的节能能力。能量计算结果表明大多数位于温带和热带气候的城市都能从使用优化TRC窗户中受益以减少冷却能耗。

结论

本研究通过平均分段线性回归技术系统研究了基于因子分解机的主动学习算法在不同设计空间规模下实现高效收敛所需的最优初始数据量。研究结果表明,充足初始数据对于提升量子兼容优化效率、降低计算成本具有关键作用,为大规模组合优化问题提供了重要的初始化策略指导,推动了量子计算增强的材料设计范式发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号