基于DFT与分子动力学模拟数据集构建苯基邻苯二甲酰亚胺衍生物缓蚀剂筛选的机器学习框架

【字体: 时间:2025年09月21日 来源:Results in Engineering 7.9

编辑推荐:

  本研究针对金属腐蚀带来的巨大经济损失,开发了一种结合密度泛函理论(DFT)、分子动力学(MD)模拟与机器学习(ML)的计算框架,用于高效筛选苯基邻苯二甲酰亚胺衍生物作为碳钢缓蚀剂。研究人员通过人工神经网络(ANN)模型实现了对最高占据分子轨道能(EHOMO)、最低未占分子轨道能(ELUMO)和吸附能(Eads)的高精度预测(R2>90%),并通过SHAP和PFI分析揭示了关键分子描述符B06[C-N]和qnmax的重要作用。该研究为绿色缓蚀剂的理性设计提供了新范式,显著降低了实验筛选成本。

  

金属腐蚀是一个全球性的工业难题,每年造成高达2.5万亿美元的经济损失,相当于全球GDP的3.4%。碳钢作为应用最广泛的金属材料,在石油管道、化工设备、汽车制造等领域发挥着重要作用,但其易受CO2和H2S等介质的腐蚀问题始终困扰着工业界。传统有机缓蚀剂虽然能通过形成保护膜抑制腐蚀,但实验筛选过程耗时耗力,且缺乏理性设计指导。

在这项发表于《Results in Engineering》的研究中,印度尼西亚大学的研究团队开创性地将量子化学计算、分子模拟与机器学习相结合,建立了苯基邻苯二甲酰亚胺衍生物缓蚀剂的高通量筛选平台。研究发现这类化合物中的氮(N)和氧(O)杂原子能作为电子给体,与金属表面形成牢固的化学吸附,其平面共轭结构更有利于形成致密的保护层。

研究采用了多尺度计算方法:首先通过密度泛函理论(DFT)计算284种苯基邻苯二甲酰亚胺衍生物的电子结构参数(EHOMO、ELUMO等),采用B3LYP泛函和6-31G(d)基组;利用分子动力学(MD)模拟计算化合物在Fe(110)晶面的吸附能(Eads),构建8×8超胞模型并添加100个水分子模拟溶液环境;使用alvaDesc软件生成5,627个分子描述符;最后采用人工神经网络(ANN)、XGBoost等多种机器学习模型建立构效关系模型,并通过SHAP和PFI方法进行特征重要性分析。

3.1. Feature reduction

通过皮尔逊相关系数(PCC)和递归特征消除(RFE)两种方法进行特征降维。研究发现即使将描述符数量从5,627个减少到1,078个(PCC≥0.2),ANN模型对EHOMO的预测精度仍保持在91.47%,证明特征降维在保持模型性能的同时显著提高了计算效率。

3.2. Feature importance and feature interpretation

通过PFI和SHAP分析发现,拓扑描述符B06[C-N](六键距C-N键存在标识)具有最高的特征重要性(PFI得分:0.016)。SHAP分析表明该描述符值为1(存在C-N键)时对EHOMO有显著正向影响。最大负电荷描述符qnmax(PFI得分:0.009)也显示出重要影响,但有趣的是较低qnmax值反而对应较高缓蚀效率,表明电子离域比局部电荷集中更重要。

3.3. B06[C-N]

C-N键在拓扑距离6处出现是最佳位置,这个距离既能保证分子大小适中(避免空间位阻),又能优化电子离域效应,促进电子从氮原子向整个共轭体系流动,增强与金属表面的电子给受能力。

3.4. qnmax

与常规认知不同,研究发现较低的最大负电荷值(qnmax)反而对应较高的缓蚀效率。这表明有效的缓蚀剂需要的是良好的电子离域能力,而非单个原子的强电负性,这与B06[C-N]的发现相互印证。

3.5. P_VSA_MR_6

摩尔折射率描述符P_VSA_MR_6与缓蚀效率呈正相关,表明分子极化率和体积特性对吸附过程有重要影响。高摩尔折射率通常意味着分子含有极性官能团和复杂结构,有利于与金属表面的相互作用。

3.6. Model Validation

使用外部验证集对优化后的ANN模型进行验证,对PP-NO2、PP-Cl等5种化合物的EHOMO预测误差小于0.2 eV,缓蚀效率预测误差小于4%。对2-(2-苯甲酰苯基)异吲哚啉-1,3-二酮的带隙预测值为3.87 eV,与实验值3.83 eV高度吻合。

3.7. Generalization of framework and model limitation

该框架可推广至其他有机缓蚀剂体系,但前提是需要预先建立电子性质与缓蚀效率间的定量关系。当前模型仅针对苯基邻苯二甲酰亚胺衍生物,且数据集规模有限,扩大数据集可进一步提升模型泛化能力。

研究结论表明,ANN模型在预测苯基邻苯二甲酰亚胺衍生物的电子结构性质方面表现出色(R2>90%),显著优于传统机器学习模型。通过特征重要性分析发现的B06[C-N]和qnmax等关键描述符,为理性设计高效缓蚀剂提供了分子层面的指导。建立的线性关系模型(缓蚀效率=181.55+15.688×EHOMO)实现了从电子结构参数到实际缓蚀性能的准确预测。

该研究的重要意义在于首次建立了完整的计算辅助缓蚀剂设计框架,将量子化学计算、分子模拟和机器学习有机融合,实现了从分子描述符到缓蚀性能的端到端预测。不仅为绿色缓蚀剂的开发提供了新思路,也为计算材料学在工业应用中的推广提供了成功范例。特别在油气工业领域,该方法可显著降低缓蚀剂研发成本和现场试验风险,具有重要的工程应用价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号