
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于Eyring速率理论的物理启发式神经网络在液体粘度预测中的应用与优化
【字体: 大 中 小 】 时间:2025年08月29日 来源:Journal of Cheminformatics 5.7
编辑推荐:
针对有限数据下材料性质预测的挑战,Maximilian Fleck等研究者通过整合Eyring速率理论与图神经网络(GNN),开发了一种物理启发的机器学习架构,用于预测纯液体的温度依赖性粘度。研究证实汽化热(ΔEvap)是粘度预测的关键描述符,建立的模型在减少训练数据需求的同时保持较高预测精度,为材料科学中的传输现象研究提供了新范式。
在材料科学和化学工程领域,液体粘度的准确预测一直是极具挑战性的课题。传统机器学习(ML)方法在数据稀缺时表现受限,而纯粹的分子动力学(MD)模拟又面临计算成本高昂的问题。Chew等人先前的研究虽然通过整合MD描述符提升了预测效果,但未能深入解释为何汽化热(ΔEvap)会成为最关键的特征描述符。这一物理机制的空缺,正是Maximilian Fleck团队开展本项研究的出发点。
研究团队从1937年Ewell和Eyring提出的经典速率理论中获得灵感。该理论将粘性流动视为分子克服势垒的活化过程,建立了粘度(η)与汽化能(ΔEvap)、摩尔体积(V)、温度(T)的定量关系(式1)。通过对957种物质3582个数据点的分析发现,虽然存在系统偏差,但Eyring方程确实能捕捉粘度随温度变化的定性规律。这一发现为构建物理启发的机器学习模型奠定了理论基础。
研究采用的关键技术包括:1)基于图神经网络(GNN)的架构设计,使用原子描述符(如Lennard-Jones参数σ、ε)和MD描述符(ΔEvap、V等)作为输入;2)引入边缘池化(edge pooling)和跳跃连接(jumping knowledge)等图网络技术;3)将Eyring方程作为物理约束嵌入神经网络(式3-4);4)采用物种划分的样本外验证策略,训练集/验证集/测试集按70:15:15比例分配。
研究结果部分显示:
物理基础验证:通过参数n(反映分子对称性)与偏移量a2的线性关系(图2),证实Eyring理论中活化能与汽化能的比例假设成立,且n值能有效表征分子链长特征。
模型性能比较:整合MD描述符的模型(图4右)比无MD特征的版本(图4左)具有更好的泛化能力,测试集RMSD降低约30%,验证了Chew等人关于MD描述符重要性的结论。
数据效率优势:引入Eyring方程使模型在减少50%训练数据时仍保持可比性能,显著提升了小样本场景下的预测可靠性。
结论部分强调,这项工作通过理论解析和算法创新实现了双重突破:一方面从Eyring速率理论角度阐明了汽化热描述符的物理本质——粘度本质上反映了"单自由度汽化"的分子过程;另一方面开发的物理约束神经网络架构,相比传统QSPR方法减少了数据依赖。该成果发表于《Journal of Cheminformatics》,不仅为材料传输性质预测提供了新工具,其"理论引导机器学习"的研究范式对溶剂设计、电池电解液开发等领域都具有重要启示。未来通过与σ-profile描述符或超额吉布斯能(excess Gibbs energy)等方法结合,可进一步扩展至混合体系的性质预测。
生物通微信公众号
知名企业招聘