基于轻量级深度学习模型的激光诱导击穿光谱矿物检测通用校准传输方法

《Optics & Laser Technology》:Universal calibration transfer method for Laser-Induced breakdown spectroscopy of mineral detection based on a lightweight deep learning model

【字体: 时间:2026年02月20日 来源:Optics & Laser Technology 4.6

编辑推荐:

  本文提出一种基于深度迁移学习的标准免费校准转移框架,解决LIBS技术在异构仪器间应用时模型适配问题。通过添加全连接层适应新数据,实验表明该方法在硅酸盐等复杂成分分析中优于传统TrAdaBoost,为火星等远程探测场景提供有效解决方案。

  
颜宇
长春大学电子与信息工程学院,中国长春130022

摘要

激光诱导击穿光谱(LIBS)结合深度学习已经证明了其作为检测材料成分的有效传感技术。然而,不同系统之间缺乏通用光谱模型的问题已成为阻碍该技术应用的一个重大障碍。校准转移(CT)策略对于缓解这些差异至关重要;然而,传统方法面临着重大挑战。通常,传统的CT方法需要在两种仪器上测量配对的转移标准。这一要求在远程探索场景中往往不可行,例如涉及火星探测车的场景。为了解决这个问题,我们提出了一种基于深度迁移学习的新型无标准CT框架,使得无需共享转移标准即可在不同光学发射数据集之间进行模型适配。该框架具有“通用性”的双重能力:(1)它确保了在不同传感系统(不同的仪器分辨率和环境条件)之间的适应性,而无需物理标准匹配;(2)它在多种元素组成下表现出强大的鲁棒性。具体来说,对于这种CT方法,添加了额外的全连接(FC)层来处理新数据。这些额外的FC层有助于学习新的场景变异性,从而重新校准主架构的输出。在主要氧化物(SiO2、Al2O3和K2O)上的实验验证表明,这种改进的微调策略在预测准确性上显著优于传统的TrAdaBoost方法。这种无标准的方法提高了CT在精确量化矿物中主要元素方面的应用性。此外,它还有助于促进物理化学传感应用社区内的模型共享。

引言

激光诱导击穿光谱(LIBS)是一种原子发射光谱技术,通过用脉冲激光烧蚀样品来实现快速的多元素分析[1]、[2]、[3]。近年来,LIBS技术发展迅速,并已在矿物学、考古学、生物医学科学和空间探索等领域得到广泛应用[4]、[5]、[6]、[7]、[8]、[9]。特别是在需要远程元素分析的领域,LIBS已成为目前唯一可行的检测方法[10]、[11]。近年来,LIBS技术在深空探索中的独特优势得到了广泛认可,并被NASA用于2020年发射的SuperCam火星探测车[12]。
然而,随着光谱技术应用场景的日益复杂,基于主光谱仪(源域)建立的校准模型通常无法泛化到另一个光谱仪(目标域),因为存在数据集偏移现象。鉴于这些情况,(源和目标)域可能存在几种差异:(i)边际分布变化,即协变量偏移;(ii)标签分布变化,即先验偏移;(iii)条件分布变化,即条件偏移;或这些情况的组合。图1使用一些模拟光谱示例了域之间可能存在的四种差异方式[13]、[14]。红色和蓝色线条分别对应源域和目标域的输入数据,并与条形图的颜色定义一致。左侧的直方图展示了第变量/光谱通道(P(X = Xi)的概率密度以及元素浓度(P(Y))的分布。在光谱学中,当测量条件发生变化时(例如,当模型应用于类似的光谱仪时),必须预期协变量偏移;而当目标域中出现新的矩阵成分(蓝色光谱包含额外的峰值)时,条件偏移就会成为一个问题。当目标域和源域之间的响应(标签空间)分布不同时,就会发生先验偏移。在实际应用中,通常会发现协变量偏移和先验偏移的结合。
纠正这些差异的过程被称为校准转移(CT)[15]、[16]、[17]、[18]、[19]。然而,大多数现有的CT模型只能用于单一元素[20],预测其他元素通常需要许多样本来重建模型[21]。因此,设计一种通用的跨元素CT方法非常有趣,以便能够快速将一个光谱仪上的定量分析模型转移到另一个元素的分析模型上。对于本研究中使用到的LIBS数据集,不同位置的新干涉峰并不常见。Pilleri[22]基于标准样品对三种光谱仪MarSCoDe、ChemCam和SuperCam进行了交叉验证。比较这三种设备的光谱显示,LIBS信号具有极好的一致性,特征光谱线也完全吻合。因此,本研究重点关注涉及仪器间变异性(协变量偏移)和样品组成变化(先验偏移)的CT场景。
随着大规模光谱数据集的增多,深度学习在模拟复杂非线性光谱特征方面展示了比传统化学计量学更优越的潜力。深度迁移学习(TL)已应用于图像、语音和自然语言处理领域[23]、[24]、[25]、[26]。然而,尚不清楚“通用”的深度学习方法是否能够适应特征和样本有限的LIBS数据。当前的CT方法主要解决相同分辨率仪器之间的光谱转移问题[27]、[28]、[29]、[30]。关于不同分辨率光谱之间转移的研究仍然有限。目标和源数据是用相同类型的设备测量的,并且它们没有在具有显著差异的数据集上进行测试。实际上,关于用于信息重建的低分辨率光谱转移到高分辨率光谱的信息很少,而LIBS光谱的先验知识通常非常复杂,其退化情况也往往未知。当前的研究是一个里程碑。Wang等人[31]通过三层全连接(FC)网络提取了源域和目标域的特征,并使用域适应函数减少了源域和目标域之间特征分布的差异。然而,随着模型层数的增加,模型变得难以训练,并且容易受到梯度消失现象的影响,从而限制了模型转移过程的有效性。Kepes等人[32]收集了两个校准数据集之间的部分重叠信息,并利用这些重叠将ChemCam光谱的一部分转换为SuperCam光谱。随后,这些转换后的光谱被用来扩展SuperCam回归模型的训练数据,从而显著提高了回归模型的性能。然而,不同仪器和设备数据之间的一致关系难以有效表征,需要根据数据定制“一对一”的模型,这还有很大的改进空间。因此,研究适用于LIBS光谱定量分析的通用CT方法在检测材料成分方面具有重要的应用价值。需要明确的是,本工作中定义的“通用校准”是指所提出的TL框架的方法论泛化能力,而不是适用于所有物理场景的单一静态模型。此外,“无标准”一词明确表示消除了在主从仪器上测量相同物理标准样品(配对标准)的要求。它并不意味着无监督的适应。与传统的CT方法[33](例如,分段直接标准化(PDS)、直接标准化(DS)不同,后者依赖于从配对标准样品中得到的特定转移矩阵——限制了它们的使用范围——我们的无标准CT方法提供了一个通用接口。它通过适应特定于域的特征分布来迁移光谱知识,而无需重新校准整个特征提取机制,从而支持在不同仪器配置(主/从域)和多样化的地质基质(硅酸盐、碳酸盐)之间的迁移。虽然像动态正交投影(DOP)[34]这样的方法提供了无标准的替代方案,但它们受到线性假设的限制。对于像Si这样的元素来说,这种限制尤为关键,因为Fe和Ti的严重光谱干扰会导致复杂的非线性依赖关系。卷积神经网络(CNN)通过提取形态学光谱特征,在转移过程中具有明显的优势。
在最近的深度学习研究中,计算机视觉任务中处理的图像数据通常是二维(2D)信号,因此通常使用2D卷积[35]。然而,现有的2D CNN模型在将LIBS光谱转换为2D数据后用于分析时,会增加模型的计算成本[36]。因此,本研究采用1D CNN架构来提取局部光谱特征,并结合基于模型的TL策略。微调是基于模型的TL中最广泛采用的方法[37],因为这些方法假设源网络中的参数是有用的,但需要使用目标数据进行训练以更好地适应目标域。基于微调的TL的一个优点是它能够使预先训练好的模型适应各种域。诸如GoogLeNet、VGG和ResNet-50等著名的深度架构是在包含数百万图像的广泛数据集上训练的(例如,ImageNet)。通过基于微调的TL,这些模型只需少量数据样本就可以适应新任务,并且通常仍能产生最先进的结果。此外,由于基于微调的TL使用了目标域的标签,它可以有效地解决所有类型的域偏移问题。在这种情况下,本工作的主要动机是规避与单独模型定制相关的繁琐实验负担。我们选择分析Si、Al和K元素作为实验目标,因为它们涵盖了三个代表性的范围,并且创新地将CT的应用扩展到了不同仪器之间的元素分析。更重要的是,我们比较了不同微调训练方案(仅训练FC层或训练所有网络层)对目标域中模型性能的影响。实验结果表明,所提出的框架显著优于传统的Transfer Adaptive Boosting(TrAdaBoost)算法[38]。本研究中提出的CT算法可以重建由于低分辨率光谱而丢失的详细信息,为在不同工作环境中收集的多个LIBS设备之间的光谱数据进行交叉校准研究提供了理论基础。
该框架的三个新颖贡献是:首先,在结构层面,与大多数遵循开发更深层次架构惯例的数据驱动深度模型不同,我们引入了一个结合了微调的浅层CNN,平衡了实现的便捷性和高性能。其次,在性能方面,我们通过将特定的无层冻结协议集成到混合偏移和先验偏移CT实现中,增强了我们的方法,使其超越了传统的协变量偏移校准。在处理不同大小的非线性数据建模时,我们提出的方法表现出显著的准确性,并且与传统的黑盒方法有所不同。最后,在应用层面,我们通过将定量分析方法纳入与火星和类月球环境相关的实际场景中,扩展了传统的类似火星的矿物元素分析。

数据集片段

数据集

为了评估所提出的转移策略在各种情境下的有效性和稳定性,我们建立了两个数据集来验证光谱模型。数据集1(Chem408-Super2562)包含来自SuperLIBS(2022年,2562种目标物质)[39]和ChemCam(2016年,408种目标物质)[40]数据库中相同样品的光谱数据。数据集2(Chem408-Chem69)包含来自ChemCam(2010年,69种目标物质)[41]和ChemCam(2016年,

实验方案

为了验证TL在LIBS回归分析中的优势,本文设计了两种不同的实验方案。主从光谱数据之间存在较大的基线漂移、波长漂移和强度波动,转移变得困难。为了验证CT效果,比较了微调后的CT方法、传统的TrAdaBoost CT(基线)方法和不使用CT方法的实验方法,对这两个光谱转移数据集进行了分析和对比。

结论

在新仪器上的光谱预测或跨元素检测中,传统的化学计量多变量校准模型或直接使用深度学习模型并不能提供满意的结果。在本研究中,为了挖掘深度学习模型与LIBS激光系统样本的通用性,采用了基于模型微调概念的深度CT策略,并提出了不同的转移方案(仅训练FC层或训练网络的所有层)以实现

数据可用性声明

本研究中使用的光谱数据可以从NASA行星数据系统公开下载。

CRediT作者贡献声明

颜宇:写作——审稿与编辑,写作——原始草稿,可视化,验证,监督,软件,资源,项目管理,方法论,调查,资金获取,正式分析,数据管理,概念化。

利益冲突声明

作者声明他们没有已知的可能会影响本文报告工作的竞争性财务利益或个人关系。

致谢

本工作得到了长春大学博士研究启动基金项目的支持。作者们想要感谢众多研究人员和社区(长春科技大学吉林大学人工智能学院、山西大学等)在光谱学、定量分析和卷积神经网络领域所做的杰出贡献。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号