基于动态物理引导的神经网络,用于预测TiAl基金属间化合物的热变形行为
《Materials Genome Engineering Advances》:Dynamic physics-guided neural network for predicting hot deformation behavior of TiAl-based intermetallic alloys
【字体:
大
中
小
】
时间:2025年09月26日
来源:Materials Genome Engineering Advances
编辑推荐:
针对Ti-2AlNb合金高温变形行为复杂的问题,本研究通过实验与动态物理指导神经网络(DPGNN)方法结合,发现传统Sellars本构模型难以准确捕捉其应力应变响应,而DPGNN模型通过物理约束与数据驱动分支自适应融合,显著提升预测精度(测试R2>0.98),并成功泛化到Ti4822合金系统。研究揭示了O相演化、动态再结晶与应力诱导相变对变形行为的耦合作用机制。
Ti-Al基的金属间化合物因其卓越的机械性能而被视为高温结构应用的有前途候选材料。这类合金具有低密度、高比强度以及出色的高温机械性能和抗氧化能力,使其在航空航天和汽车工业中受到广泛关注。然而,这些合金在加工过程中也面临诸多挑战,尤其是Ti?AlNb合金,其复杂的多相微观结构使得热变形建模变得困难重重。Ti?AlNb合金通常包含B2基体、增强的O-Ti?AlNb相以及脆性的α?-Ti?Al相,其热变形行为与传统的TiAl合金相比更为复杂,因此,传统的构成模型在预测其流变行为时存在一定的局限性。
热变形是结构合金加工制造过程中的基本阶段,包括镍基超合金、钛基合金、金属间化合物合金以及高熵合金等。通过高温下的锻造、轧制和挤压等热机械工艺,可以实现显著的塑性变形,并驱动动态再结晶(DRX)等微观结构演化。因此,对不同应变、应变速率和温度条件下的流变应力进行准确理解和建模,对于优化加工设计和确保高温下可靠部件性能至关重要。
为了应对这一挑战,研究者们在过去几十年中提出了多种构成模型,用于预测TiAl金属间化合物及其他结构合金的热变形行为。经典的现象学模型,如Johnson-Cook(JC)、Zerilli-Armstrong(ZA)以及Sellars-Tegart的Arrhenius型模型,被广泛应用于描述流变应力。例如,Kong等人使用Arrhenius型模型预测Ti-48Al-2Cr-4Nb-0.2Y合金的峰值应力,而Cheng等人则引入了结合不同软化机制的模型,以准确估算高Nb含量TiAl金属间化合物的流变应力。尽管这些模型在某些情况下具有实用性,但它们通常针对特定材料或变形条件进行调整,难以准确捕捉由动态微观结构演化引起的复杂流变行为。
近年来,机器学习(ML)为建模热变形行为与复杂加工环境之间的非线性关系提供了新的范式,尤其是在物理机制尚不明确或过于复杂的情况下。Xiong等人利用GPR、随机森林(RF)、支持向量机(SVM)和人工神经网络(ANN)等ML算法,研究了Ti4822合金和FGH98超合金的热变形行为,发现ML模型在这些合金中表现优于传统构成模型。Ge等人则对比了ANN模型与Arrhenius型模型在高Nb含量TiAl合金中的表现,发现ANN模型在预测热变形行为方面具有更高的准确性。这些数据驱动的方法具有灵活性,能够拟合实验数据中的应力峰值、流变软化和突变转变等特征。然而,由于高温测试成本较高,热变形数据集往往较小,纯粹的ML模型在数据稀缺情况下可能难以泛化。
为了解决这一问题,研究者们探索了将物理知识嵌入ML建模的方法,以提供额外的约束和信息先验,从而克服小数据限制并保留可解释性。受此启发,本研究提出了一种动态物理引导的神经网络(DPGNN),用于预测Ti?AlNb合金的热变形行为。该混合框架由三个核心组件组成:基于物理的分支、数据驱动的分支以及一个动态门控网络,如图1所示。基于物理的分支是Sellars构成模型的神经网络扩展,每个参数(A、n、α、Q)被建模为应变、应变速率和温度的函数,而非仅依赖应变。为确保参数的符号一致性,对每个网络输出应用了SoftPlus激活函数,并添加了一个微小的偏移量(1×10??)。为了避免材料特定的偏差,未在损失函数中引入额外的范围限制。这种灵活的参数化方法有助于模型捕捉不同变形条件下的复杂、过程依赖的微观结构演化。在前向计算过程中,预测的参数被代入修正后的Sellars模型(方程3),以获得具有物理意义的预测应力σ_physics。
数据驱动的分支则是一个标准的ANN,由三个全连接线性层和ReLU激活函数组成。该网络直接将应变、应变速率和温度作为输入,映射到预测的流变应力σ_data。它负责捕捉由物理构成定律未描述的实证和潜在非物理趋势。一个浅层的ANN作为门控网络,用于结合两个分支的优势。门控网络接收相同的输入,并通过SoftMax激活函数输出两个权重,分别代表物理分支(ω_physics)和数据驱动分支(ω_data)对每个预测的贡献。权重为非负数且总和为1。最终的流变应力是两个分支输出的加权和,使得模型能够在构成拟合可靠时强调物理分支,而在需要时更多依赖数据驱动分支。
所有子网络均通过预测值与测量值之间的均方误差进行端到端联合训练。在训练前,输入数据被标准化为零均值和单位方差。此外,一个与数据驱动分支具有相同架构的纯数据驱动模型ANN作为基线,用于量化引入物理约束带来的优势。
模型的性能评估基于决定系数(R2),其计算公式如方程4所示,其中R2越大,预测性能越好,R2=1表示完美拟合。一般情况下,R2值用于衡量模型的预测能力,同时也能反映模型与实验数据之间的拟合程度。
研究结果表明,Ti?AlNb合金的流变应力行为源于应变硬化、动态再结晶引起的软化、O相的溶解以及应力诱导的相变温度变化。这种复杂的微观结构演化使得流变应力预测变得困难。因此,研究团队引入了DPGNN模型,并将其与纯数据驱动的ANN模型以及Sellars构成模型进行了比较。在没有交叉验证(CV)的情况下,DPGNN和ANN模型的R2值分别达到了0.9911和0.9889,远高于Sellars构成模型。在五折CV过程中,DPGNN模型的CV-R2值为0.9712,表明其具有良好的稳定性和泛化能力。相比之下,纯数据驱动的ANN模型的CV-R2值为0.9640,而Sellars构成模型的CV-R2值则出现了负值(?2.0277),突显了传统构成模型的固有局限性和对加工参数的敏感性。因此,DPGNN模型在预测复杂或非常规变形行为的合金时展现出更高的准确性和鲁棒性。
在测试集上,DPGNN模型在Ti?AlNb和Ti4822合金中均表现出色,其测试-R2值分别为0.9833和0.9828,远高于Sellars构成模型的测试-R2值(分别为0.6431和0.9221)。这进一步表明,将物理引导约束嵌入DPGNN模型可以提高预测的准确性并减少异常误差。此外,DPGNN模型在所有测试中保持预测误差低于100 MPa,而纯数据驱动的ANN模型在某些点上预测误差超过了100 MPa,凸显了DPGNN模型在复杂变形行为预测中的优势。
通过在Ti4822合金上的测试,进一步验证了DPGNN模型的泛化能力。Ti4822合金是一种广泛研究的TiAl基金属间化合物合金,其实验细节在图S4中给出。如图9a和d所示,Sellars构成模型在Ti4822合金上表现良好,其训练-R2值为0.9638,测试-R2值为0.9221。然而,DPGNN模型仍然表现出更高的预测准确性,其CV-R2值为0.9711,测试-R2值为0.9828,均优于纯数据驱动的ANN模型(CV-R2值为0.9345,测试-R2值为0.9761)。这一结果表明,DPGNN模型在结合物理知识与数据驱动学习方面具有显著优势,能够提升预测的准确性与鲁棒性。
总体而言,本研究开发的DPGNN模型通过整合物理约束与数据驱动学习的灵活性,成功克服了传统构成模型和纯数据驱动模型在预测复杂TiAl金属间化合物合金热变形行为时的局限性。该模型不仅在Ti?AlNb合金上展现出高准确度(测试-R2>0.98),而且在Ti4822合金上也表现出良好的泛化能力。这种结合物理原理的机器学习方法为高温结构材料的机械性能预测提供了一种可靠且强大的工具,有助于推动先进合金的设计和开发。
未来的工作可以进一步拓展物理库,以包含多种物理机制,并允许模型通过概率选择、学习的门控函数或其他自适应策略进行选择。此外,还可以通过其他途径嵌入物理知识,如可微分的微观结构模拟器、受约束的潜在变量或物理引导的数据增强,而非仅仅依赖于当前的构成形式。这些改进将有助于提升模型在复杂变形机制下的预测精度与适应性,为高温服务关键材料的预测建模提供更加全面和灵活的解决方案。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号