无偏且免增强的自监督图对比学习技术在矿化相关地球化学异常检测中的应用研究

【字体: 时间:2025年06月24日 来源:Journal of Geochemical Exploration 3.4

编辑推荐:

  针对传统图对比学习(GCL)算法因数据增强导致关键邻域信息丢失的问题,研究人员提出无偏免增强自监督图对比学习(USAF-GCL)新方法。基于吉林白山地区1:20万水系沉积物数据构建模型,结果显示USAF-GCL的AUC(0.9545)和AUPRC(0.9312)显著优于GCL模型,异常区面积减少7.9%却多识别7%已知矿床,为高维地球化学异常检测提供了可靠工具。

  

在地球化学勘探领域,识别与矿化相关的异常信号如同大海捞针——高维数据中隐含的非线性模式、复杂空间结构以及稀缺的标记样本,使得传统统计方法(如主成分分析PCA和分形分析)难以捕捉微弱但关键的矿化信号。更棘手的是,新兴的图对比学习(Graph Contrastive Learning, GCL)虽能利用样本间拓扑关系,但其依赖数据增强的操作往往会破坏原始图结构中的地质关联。这一矛盾促使中国吉林大学的研究团队在《Journal of Geochemical Exploration》发表创新成果,提出无偏免增强自监督图对比学习(USAF-GCL)技术,通过保护原始图数据的完整性,实现了对矿化异常更精准的检测。

关键技术包括:1) 基于吉林白山地区1:200,000水系沉积物调查数据构建图结构(节点=样本,边=空间关系);2) 设计无需数据增强的图学习器优化原始拓扑;3) 采用ROC曲线、PR曲线和F1分数等指标对比USAF-GCL与GCL模型性能;4) 通过已知多金属矿床验证异常区地质合理性。

Geological setting and polymetallic deposits
研究区位于华北地台北缘的白山地区,该区域复杂的地质演化历史造就了铜-铅-锌-金多金属成矿带。通过分析4幅1:20万地质图,确认早元古代变质岩系与中生代岩浆活动为成矿提供物质来源,这为后续异常检测提供地质依据。

Graph contrastive learning (GCL)
传统GCL需通过节点/边删除等增强操作生成对比视图,可能丢失关键空间关联。而USAF-GCL创新性地采用图学习器直接优化邻接矩阵,保留原始数据中局部(如元素短程交互)和全局(区域地质过程)依赖关系,其编码器通过最大化正负样本表征差异实现自监督学习。

Results
USAF-GCL模型的AUC(0.9545)显著高于GCL(0.8601),且仅用17.1%的勘探面积即100%覆盖已知矿床(GCL需25%面积仅识别93%矿床)。PR曲线下面积(AUPRC)的悬殊差异(0.9312 vs 0.026)进一步证实其对正样本的强辨识力。

Discussion
异常区与已知矿体的空间吻合度验证了USAF-GCL的可靠性。其优势在于:1) 避免增强操作引入的偏差;2) 通过图学习器捕获多尺度地质特征;3) 对高维噪声具有鲁棒性。但研究也指出,未标记样本的质量可能影响预训练效果。

Conclusion
该研究开创性地将USAF-GCL引入地球化学领域,其构建的自监督框架突破了传统方法对线性假设和数据增强的依赖。不仅为矿产勘探提供新工具,其"数据无损"理念对处理其他空间关联数据(如环境污染物分布)具有普适意义。国家自然科学基金(42472361)的支持凸显了该研究的战略价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号