
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于表征学习的矿产资源预测方法MRLMRP:复杂关联挖掘与精度提升研究
【字体: 大 中 小 】 时间:2025年05月26日 来源:Expert Systems with Applications 7.5
编辑推荐:
针对传统矿产资源预测方法依赖人工经验、难以捕捉矿点-矿物复杂关联的问题,研究人员提出基于表征学习的MRLMRP方法。该方法通过构建双分图嵌入空间、设计信息传播机制,将Precision@1指标从18.82%提升至51.02%,为地质勘探提供了创新性数据驱动工具。
矿产资源是经济社会发展的重要物质基础,也是探索地球演化历史的关键证据。然而随着浅表资源枯竭,深部矿体勘探难度和成本急剧上升。传统预测方法依赖专家经验(如分析植被环境、地球化学异常等),存在主观性强、建模复杂等问题。近年来,基于共现频率的关联模式方法(如Morrison等2023年研究)虽取得进展,但简单统计难以揭示矿点-矿物间的非线性关联,导致预测精度瓶颈(Precision@1仅18.82%)。
中国湖北省自然科学基金和国家自然科学基金支持的研究团队提出突破性解决方案——矿物表征学习预测方法(Mineral Representation Learning for Mineral Resource Prediction, MRLMRP)。该方法首次将自然语言处理和图计算中的表征学习理论引入地质领域,通过双分图编码器将全球810,907个矿点-矿物对映射到潜在向量空间,在《Expert Systems with Applications》发表的研究中实现了51.02%的Precision@1指标。
关键技术包括:1) 基于矿物演化数据库(Mineral Evolution Database, MED)构建矿点-矿物双分图;2) 设计虚拟节点缓解长尾分布偏差;3) 引入相似性类比理论(Similarity Analogy)优化向量空间;4) 采用自监督重构损失函数。
【Mineral resource prediction】
研究指出传统数学地质学方法(Mathematical Geology)依赖多元统计模型,而数据驱动方法如MRLMRP通过挖掘MED数据库中295,383个矿点与5,478种矿物的高阶关联,显著提升预测效率。
【Framework overview】
MRLMRP创新性解决两大挑战:1) 通过图编码器捕获矿点与矿物的跨模态特征;2) 从数据和模型双维度补偿稀疏矿点信息。实验证明其F1-score较协同过滤方法提升37%。
【Dataset】
采用MED数据库(含810,907对关联数据)验证方法普适性,特别针对美国三个典型矿点的矿物组合(如Location 1的Acanthite-Quartz共生体系)进行案例验证。
【Comparison with recommendation methods】
对比实验显示,MRLMRP在NE、AUC等指标上超越User-based CF、BPRMF等推荐算法,尤其对Chalcopyrite等低频矿物预测准确率提升显著。
【Conclusion】
该研究开创性地建立了地质学与人工智能的交叉方法论,不仅将预测精度提升2.7倍,更为岩石、地层等地质事件研究提供新范式。未来将通过整合地质属性(如hydrothermal action)进一步增强模型鲁棒性。
研究团队特别声明,Diange Zhou负责核心算法设计,Shengwen Li参与理论验证,Hong Yao指导项目方向。成果获得中国国家自然科学基金(42071382)资助,相关代码已开源。
生物通微信公众号
知名企业招聘