一种基于机器学习的简单方法,用于预测聚合物基复合材料的千周疲劳寿命

《Results in Engineering》:A straightforward machine learning-based giga-cycle fatigue life regression approach for polymer matrix composites

【字体: 时间:2025年11月08日 来源:Results in Engineering 7.9

编辑推荐:

  复合材料的疲劳寿命预测研究提出基于高斯噪声的分组数据增强方法,结合XGBoost回归模型处理小样本数据(≥20点)。实验涵盖CF-PEKK、GF-Epoxy等复合材料在循环弯曲、拉伸等载荷下的HCF(10?-10?)、VHCF(10?-10?)和GCF(>10?) regime。结果表明XGBoost在应力范围分布不均时仍保持高精度(R2最高0.94),尤其适用于仅含50%训练数据的场景,为工程材料选型提供可靠工具。

  在现代工程领域,复合材料因其优异的强度重量比和耐腐蚀性,被广泛应用于航空航天、汽车制造以及风力涡轮机叶片等结构。然而,复合材料的疲劳性能研究面临诸多挑战,尤其是高周次疲劳(HCF、VHCF、GCF)数据的获取。传统实验方法在获取这些数据时,不仅耗时耗力,而且成本高昂。为了应对这一问题,近年来机器学习(ML)技术被引入疲劳寿命预测,展现出良好的潜力。然而,由于复合材料在疲劳过程中的复杂行为,特别是其各向异性与不均匀性,现有的ML模型在处理有限数据集时仍然存在局限。因此,本文提出了一种基于高斯噪声的“bin”数据增强方法,结合极端梯度提升回归器(XGBoost),以实现对不同疲劳范围和加载条件下的复合材料疲劳寿命的合理预测。

### 复合材料疲劳行为的复杂性

复合材料的疲劳行为比各向同性材料更为复杂,这主要源于其结构特性。例如,碳纤维增强聚合物(CFRP)在应用中通常经历超过15年的服役寿命,因此需要评估超过10^7次循环的疲劳性能。然而,由于材料缺陷、纤维-基体结合力以及材料质量的差异,即使相同几何形状和材料特性的复合材料,其疲劳寿命也会出现显著的离散性。这种离散性使得实验数据的预测变得更加困难,尤其是在高周次疲劳条件下。此外,复合材料在疲劳过程中的自加热现象,也增加了实验结果的不确定性,进一步限制了其在实际工程中的可靠应用。

### 机器学习在疲劳预测中的应用

随着数据科学和计算能力的快速发展,机器学习在材料科学中的应用越来越广泛。ML模型具有处理复杂数据集的能力,尤其是在数据量有限的情况下,能够通过迭代学习调整自身以适应数据特征。然而,不同ML模型在疲劳寿命预测中的表现差异较大。例如,线性回归模型(LR)适用于线性关系明确的数据集,但其在处理非线性关系时存在局限。而随机森林回归(RFR)和极端梯度提升回归(XGBoost)则能更好地处理非线性关系,并在数据中存在噪声和离散性时表现出更强的鲁棒性。支持向量回归(SVR)虽然在小数据集处理中表现出色,但其对噪声的敏感性以及对超参数的依赖性限制了其在实际应用中的广泛采用。相比之下,XGBoost作为一种梯度提升决策树算法,能够高效地捕捉数据中的非线性关系,且对小到中等规模的数据集表现良好,因此被选为本研究的核心模型。

### 数据增强方法的提出

为了克服实验数据有限的问题,本文提出了一种基于高斯噪声的“bin”数据增强策略。该方法通过对原始数据集中的应力值和疲劳寿命添加随机噪声,从而扩大数据集的覆盖范围,提高模型的泛化能力。在实际实验中,由于疲劳测试的重复性较差,数据点之间的离散性较大,因此通过数据增强可以更全面地描述材料在不同应力范围内的疲劳行为。具体来说,将原始数据划分为若干“bin”区间,并在每个区间内添加高斯噪声,以模拟实验数据的自然波动。这种方法不仅能够提高模型的训练效率,还能减少因数据不足而导致的模型过拟合问题。

### 不同数据增强策略的效果分析

通过在不同应力范围内进行数据增强,研究者发现不同ML模型的表现有所差异。例如,在高应力范围内进行数据增强时,随机森林回归模型(RFR)表现出最佳的预测效果,其R2值高达0.94。而在中等应力范围内进行数据增强时,XGBoost模型的预测精度也较高,R2值达到0.8090。相比之下,当在低应力范围内进行数据增强时,XGBoost模型的R2值为0.6721,略逊于RFR。此外,对于CF-Epoxy复合材料,当仅在极端应力范围内进行数据增强时,XGBoost模型的预测精度有所下降,这可能与该材料的疲劳行为更为陡峭有关。然而,尽管某些数据增强策略可能对模型的预测效果产生影响,XGBoost在处理数据离散性方面仍然展现出较强的鲁棒性,尤其是在数据量较少的情况下。

### 模型的预测性能评估

为了评估模型的预测性能,研究者采用了多种指标,包括R2、均方误差(MSE)、均方根误差(RMSE)和平均绝对误差(MAE)。R2用于衡量模型对实验数据的拟合程度,其值越接近1,表示模型的预测越准确。MSE和RMSE则用于衡量预测误差的大小,数值越小表示模型的预测越精确。MAE则用于评估预测误差的平均值,不考虑误差的方向。通过对这些指标的分析,研究者发现XGBoost模型在多个数据增强策略下均能提供合理的预测结果,尤其是在中等和低应力范围内,其预测精度优于其他模型。此外,对于CF-Epoxy复合材料,尽管其疲劳数据的离散性较大,XGBoost模型仍然能够提供相对准确的预测,表明其在处理有限数据集时具有较强的适应能力。

### 数据增强策略对模型性能的影响

研究还发现,数据增强策略对模型的预测性能有显著影响。例如,当数据增强集中在高应力范围内时,模型的预测精度较高,但对低应力范围的预测能力有所下降。相反,当数据增强集中在低应力范围内时,模型的预测精度相对较低,但整体上仍能提供合理的预测结果。此外,当数据增强集中在极端应力范围内时,模型的预测误差较大,尤其是在10^4到10^6次循环范围内,XGBoost模型出现了显著的过估计现象。这一结果表明,尽管数据增强能够提高模型的泛化能力,但其在不同应力范围内的效果可能不同,需要根据具体材料的疲劳行为选择合适的增强策略。

### 未来研究方向

尽管XGBoost模型在本研究中表现出色,但研究者也指出,其预测结果仍有一定的局限性。例如,模型在处理高离散性数据时可能不够精确,尤其是在材料疲劳行为陡峭的情况下。此外,虽然XGBoost模型在不进行超参数调优的情况下也能提供合理的预测结果,但进一步的优化可能会提升其准确性。因此,未来的研究可以探索结合物理信息的混合模型,例如物理信息神经网络(PINN),以提高模型的解释性和预测精度。此外,蒙特卡洛模拟(MCS)等方法也可以用于数据增强,以生成更具有物理意义的合成数据,从而提升模型的泛化能力。

### 结论

本文提出了一种基于高斯噪声的“bin”数据增强方法,结合XGBoost模型,用于预测复合材料在不同疲劳范围内的寿命。通过在不同应力范围内进行数据增强,研究者发现XGBoost模型在处理有限数据集时表现出较强的适应能力,并且在多个数据增强策略下均能提供合理的预测结果。此外,研究还表明,数据增强策略的选择对模型的预测性能有重要影响,尤其是在材料疲劳行为陡峭的情况下。未来的研究可以进一步探索物理信息与数据驱动模型的结合,以提高模型的解释性和预测精度,从而更好地支持复合材料在工程设计中的应用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号