
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多输出热化学预测新突破:基于热力学约束的神经网络方法在材料热力学性质预测中的应用
【字体: 大 中 小 】 时间:2025年06月17日 来源:Journal of Cheminformatics 7.1
编辑推荐:
本研究针对材料热力学性质预测中数据稀缺和分布外泛化难题,开发了名为ThermoLearn的热力学约束神经网络模型。该模型通过整合Gibbs自由能方程(G= E-TS)构建多输出架构,可同步预测自由能(G)、总能量(E)和熵(S)三项关键参数。在NIST-JANAF和PhononDB两个小数据集测试中,模型展现出43%的RMSE提升,且在分布外预测场景优势更为显著,为材料设计提供了高效计算工具。
在材料科学领域,准确预测热化学性质如同掌握材料的"基因密码"。Gibbs自由能(G)作为衡量材料在恒温恒压下最大可逆功的关键指标,直接影响着催化效率、能源存储等核心性能。然而传统实验方法如量热法、电化学测量不仅耗时耗力,计算手段如密度泛函理论(DFT)和分子动力学也面临计算资源消耗大的瓶颈。更棘手的是,化学数据集往往规模小且分布复杂,常规机器学习模型在数据不足或分布外(OOD)场景下表现堪忧。
针对这一系列挑战,来自TIFR Hyderabad的研究人员Raheel Hammad和Sownyak Mondal开发了名为ThermoLearn的热力学约束神经网络。这项发表在《Journal of Cheminformatics》的研究创新性地将Gibbs自由能方程融入神经网络架构,通过设计包含三项均方误差(MSEE
、MSES
和MSEThermo
)的复合损失函数,使模型能同步预测总能量(E)、熵(S)和自由能(G)。这种物理约束不仅提升了预测精度,更赋予模型在数据稀缺条件下的强大泛化能力。
研究团队采用了两项关键技术:一是特征工程方面,对NIST-JANAF实验数据集采用元素组成特征,对PhononDB计算数据集则结合晶体结构特征与图神经网络(CGCNN)特征;二是模型架构上,通过固定最终层权重实现G=E-TS的物理约束,使用Leaky ReLU激活函数缓解梯度消失问题,并采用ADAM优化器进行训练。特别设计了4折交叉验证和基于t-SNE聚类的OOD测试方案,全面评估模型性能。
研究结果展现出三个层面的突破:
基准测试方面,在694个材料的JANAF数据集上,ThermoLearn以22.51 kJ/mol的RMSE远超XGBoost(36.11)和普通神经网络(32.19);在873个金属氧化物的PhononDB数据集上,14.20 kJ/mol的误差也显著优于CGCNN(31.90)和MEGNet(70.23)。
分布外预测中,当训练集与测试集来自t-SNE聚类不同簇时,模型优势进一步扩大:在JANAF数据集上相对普通神经网络误差降低41%,R2
达到0.936;在PhononDB数据集上误差减少38%,R2
保持0.931的高水平。
温度依赖性验证显示,模型在50-1500K范围内对Ba2
TiO4
等材料的能量、熵和自由能预测与理论计算高度吻合,三项输出的R2
均达0.99以上。
这项研究的核心价值在于建立了物理规律与数据驱动模型的完美结合范式。通过Gibbs方程约束,ThermoLearn不仅解决了小数据场景的过拟合问题,其物理一致性更保证了预测结果的合理性。研究团队特别指出,该框架可扩展至其他热力学方程如Eyring方程,在生物分子等领域具有广泛应用前景。开源代码的发布(https://github.com/Sudo-Raheel/ThermoLearn)将进一步推动这一创新方法在材料设计中的实际应用。
生物通微信公众号
知名企业招聘