基于DFT与平衡数据增强的电子特气吸附参数机器学习预测研究

《Chinese Journal of Chemical Engineering》:Machine learning for adsorption-related parameters prediction of electronic specialty gases: DFT-based dataset construction and balanced data augmentation

【字体: 时间:2025年10月19日 来源:Chinese Journal of Chemical Engineering 3.7

编辑推荐:

  本文针对电子特气(ESG)吸附分离中物性参数缺失的难题,通过密度泛函理论(DFT)构建了涵盖101种分子的多维数据库,并开发了贝叶斯回归协同预测模型与平衡数据增强的Transformer分子性质预测(BD-TMPP)模型,实现了四极矩(R2=0.99)和极化率(R2=0.98)的高精度端到端预测,计算效率提升五个数量级,为吸附剂设计提供了高效AI解决方案。

  
分子性质参数数据库
本研究系统计算分析了101种与芯片生产相关的分子。首先使用Gaussian 16软件包通过DFT计算优化所有分子的几何构型,采用B3LYP交换关联泛函和def2-svpd基组。量子化学描述符包括分子极化率、电偶极矩、电四极矩和最高占据分子轨道(HOMO)等参数均在振动频率计算确认稳定结构后获得。所有参数均通过严格的收敛阈值控制以确保计算精度。
数据库分析
电子特气在芯片生产中具有重要作用,主要包括功能性反应气体和辅助工艺气体。例如氟化气体主要用于蚀刻工艺,高纯度惰性气体N2作为载气使用。本研究收集了101种芯片生产相关分子的性质数据,根据结构和化学特性将所有分子分为五个 distinct 类别。Tanimoto相似性分析表明...
结论
本研究开发了涵盖101种半导体关键分子(19种物理参数)的多维数据库,解决了电子特气研究中的关键数据缺口问题并推动了吸附剂开发进展。通过跨分类群的四个分子参数对比分析,揭示了指导吸附剂选择策略的特征性变化。利用贝叶斯回归实现了从分子性质到目标参数的多变量预测(测试集R2=0.95-0.97),而创新的平衡数据增强Transformer模型(BD-TMPP)通过捕获原子间空间相关性,在保持精度的同时将计算效率提升了五个数量级。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号