基于功能材料合成数据的机器学习揭示稀土矿化机制:数据驱动的稀土元素成矿作用研究

【字体: 时间:2025年09月29日 来源:Advanced Intelligent Systems 6.1

编辑推荐:

  本综述创新性地利用稀土功能材料水热合成数据(1200+反应记录),构建机器学习模型(KNN/RF/XGB),成功预测稀土矿化产物元素与物相。研究表明XGB模型预测精度最高(物相预测准确率96%),特征重要性分析揭示离子热力学性质主导矿化过程,回归模型可预测结晶温度与pH(r2=0.87)。该研究为稀土勘探与绿色分离提供了新范式(ML+材料数据跨域应用)。

  
引言
稀土元素(REEs)作为现代科技与可持续能源解决方案的关键材料,在石油精炼催化剂、电动汽车永磁体、照明磷光体及核反应堆控制棒等领域具有不可替代性。然而,其供应受限于地理分布不均和提取技术瓶颈,特别是稀土元素彼此分离的高成本与环境风险。自然界中稀土在原生矿床通过矿化过程实现自然分离,因此研究不同地球化学条件下的稀土矿化机制,对开发新型分离策略具有重要意义。
当前稀土矿化反应定量数据的缺乏制约了机理研究。本研究创新性地将功能性稀土材料水热合成数据作为替代数据集,利用1,240组实验室合成反应记录,通过机器学习方法揭示稀土矿化规律。该策略借鉴了化学工程中机器学习替代计算密集型模型(如密度泛函理论)的成功经验,为跨域数据应用提供新范式。
结果
机器学习模型构建与性能评估
研究采用三种机器学习算法(K近邻/KNN、随机森林/RF、极端梯度提升/XGB)预测稀土结晶反应产物元素与物相。输入特征包含前驱体类型与浓度、添加剂、溶剂条件(pH/类型/体积)、反应参数(温度/时间)以及增强特征(离子半径、电负性、热力学性质等)。
XGB模型展现出最优性能:元素预测准确率达97.4%,物相预测准确率96.0%,显著高于KNN(95.7%/88.8%)和RF(97.6%/91.5%)。其序列式决策树架构能有效修正前序误差,特别适合处理本研究的复杂多模态数据。混淆矩阵显示所有模型对阴性结果(产物中不存在的元素/物相)预测准确率均超90%。
特征重要性机制解析
通过特征消融实验量化不同特征对预测精度的影响(原始模型精度设为0,最大精度下降归一化为1)。关键发现:
  1. 1.
    增强特征中离子热力学性质(标准生成焓/熵)重要性达1.00,反应物形成能(0.35)与离子质量(0.36)次之
  2. 2.
    反应参数中温度主导(0.64),pH(0.20)、溶剂体积(0.16)和时间(0.10)依次递减
  3. 3.
    浓度参数中添加剂浓度(0.59)比反应物浓度(0.32)更重要
  4. 4.
    离子价态(0.18)显著优于元素价态(0.02),添加剂pKa值(0.13)影响结晶过程
该结果表明稀土矿化主要受热力学控制,动力学因素(温度)起次要作用。相关性分析显示反应时间与pH(0.23)、温度(0.32)、稀土浓度(0.31)呈正相关,符合经典结晶行为规律;温度与溶剂体积负相关(-0.30),反映高压反应器的安全操作限制。
实验验证与局限性
通过水热合成实验验证模型预测能力:
  • 磷酸盐体系:La/Gd磷酸盐 hexagonal 相预测准确(15组实验全部正确),Er磷酸盐 tetragonal 相预测失败(训练集缺乏重稀土磷酸盐数据)
  • 碳酸盐体系:预测性能显著下降。La碳酸盐元素预测准确率66.7%(6/9),Er碳酸盐仅33.3%(3/9),Nd碳酸盐完全未能预测Nd元素(训练集使用尿素碳源而非碳酸盐)
模型表现高度依赖训练集覆盖度:对充分表征的反应(轻/中稀土磷酸盐)预测精准,但对稀缺反应(碳酸盐/重稀土体系)泛化能力有限。这源于功能材料研究偏好磷酸盐体系的应用导向性数据偏差。
结晶条件预测模型
构建XGB回归模型预测结晶温度与pH,以前驱体/产物属性为输入特征。两者预测决定系数r2均达0.87,显示良好潜力。温度预测误差多出现于常见矿物体系(氟石/磷酸盐),因相同产物可在多温度区间形成;pH预测误差集中于含钒酸盐、钨酸盐等罕见阴离子的体系,反映自然矿物数据稀缺的局限。
讨论
本研究证实了功能材料数据用于稀土矿化研究的可行性,但存在领域适应性挑战:
  1. 1.
    数据不平衡问题:应用导向的研究导致磷酸盐数据过饱和,碳酸盐/重稀土数据匮乏
  2. 2.
    跨域差异:实验室合成(如尿素分解碳源)与地质矿化(碳酸盐离子)的条件差异
  3. 3.
    模型本质: interpolation 特性要求训练集全面覆盖目标反应空间
未来需加强碳酸盐体系与重稀土矿化的实验研究,扩充数据集多样性以提升模型泛化能力。
结论
通过机器学习成功实现了功能材料合成数据向稀土矿化研究的跨域迁移。XGB模型在数据充分区域(稀土磷酸盐)展现出高精度预测能力,特征重要性揭示了热力学性质的主导作用。结晶温度/pH预测模型(r2=0.87)为稀土分离工艺开发提供新工具。该研究范式为破解稀土数据稀缺难题开辟了新路径,对稀土资源可持续开发具有重要价值。
实验方法
数据集构建:从功能材料文献系统收集1,239组稀土水热反应数据,包含前驱体/添加剂浓度、反应条件、产物特性。使用 Mendeleev 包(元素属性)、CHNOSZ 包(离子热力学性质)、ML计算(反应物形成能)等工具增强特征。
模型训练:采用 scikit-learn 库实现KNN/RF/XGB多标签分类器,使用交叉熵损失函数与五折交叉验证。输入特征经 StandardScaler 标准化,超参数通过 GridSearchCV 优化。
合成实验:使用 Sigma-Aldrich 试剂(纯度>99%),在 Parr 反应釜(Teflon 内衬)中进行水热合成。碳酸盐体系:0.01 M REE(NO3)3 + 0.05 M Na2CO3,pH 9.0-12.35(NaOH调节),25-175°C,46 h;磷酸盐体系:0.032 M REECl3 + 0.032 M Na2HPO4,pH 1.52-10.70(HCl/NaOH调节),48 h。产物经离心清洗后分析。
回归模型:XGB回归器以反应物/产物特征预测结晶温度/pH,采用均方误差损失函数与超参数优化。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号