油纸绝缘的降解是变压器故障的主要原因之一,准确评估其老化状态对于确保电力变压器的安全稳定运行至关重要[1,2]。研究表明,溶解在绝缘油中的纤维素降解产物可以作为绝缘老化的有效指标[3,4]。其中,糠醛因其高化学稳定性、强积累能力和低挥发性而成为关键的诊断标志物[5]。糠醛的定量检测能够可靠地推断绝缘纸的老化情况,为评估变压器健康状态提供了科学依据[6,7]。然而,当前的检测系统面临两个主要挑战。首先,变压器油通常在达到一定降解程度时会被更换,这导致糠醛浓度下降,从而影响了仅基于油相糠醛含量的老化评估的准确性[8]。为了解决这个问题,一些研究[9,10]提出了校正模型来考虑油更换造成的糠醛损失。其次,快速灵敏地检测低浓度的糠醛仍然很困难。尽管高效液相色谱(HPLC)[11]、电化学分析[12]和液相色谱-质谱[5]等方法可以提高检测精度,但它们通常涉及复杂的操作、繁琐的样品预处理、漫长的分析时间以及与原位或在线监测的兼容性差,限制了它们的现场应用。传统的拉曼光谱技术可以进行现场分析,但灵敏度较低。相比之下,表面增强拉曼散射(SERS)——一种将纳米技术与拉曼光谱相结合的强大分析技术——提供了高灵敏度以及分子指纹识别和快速响应能力[13,14]。SERS在痕量级检测应用中展示了显著潜力[[15], [16], [17]]。
在识别绝缘油中的老化标志物的背景下,SERS利用局部表面等离子体共振(LSPR)效应在纳米尺度上产生强烈的电磁场增强,使目标分子的拉曼信号增强10^6到10^14倍[13,14],从而实现高效的分子识别。与传统检测技术相比,SERS具有多个优势[18]:其无标记特性降低了样品预处理过程中外来污染的风险,提高了检测精度;其快速响应能力满足了油中糠醛的实时监测需求;并且所需的样品体积很小。这些特点使SERS成为变压器油中糠醛检测的有前景的分析工具。
尽管SERS技术在变压器油中糠醛检测方面具有潜力,但在低浓度下实现目标分子的高精度识别仍面临若干技术挑战[19,20]。SERS中的信号增强主要依赖于金属纳米颗粒之间产生的电磁(EM)机制,其中LSPR在油中生成了无标记的糠醛光谱分析所需的“热点”。然而,现有的SERS基底往往均匀性较差[[21], [22], [23], [24]],增强因子(EF)的波动范围为2到3个数量级(10^2–10^3),这严重影响了定量分析的可靠性。值得注意的是,对于变压器油中糠醛的现场检测,稳健和精确的定量至关重要[[15], [16], [17],20]。因此,改进基底制造方法以生产具有一致和稳定增强效果的SERS平台已成为一个关键问题。这样的进步对于在复杂油基质中高效捕获信号和准确量化糠醛是必要的。
SERS应用于糠醛定量检测的挑战不仅归因于基底性能,还受到复杂基质效应的显著影响[19,20]。变压器油含有多种老化副产物,包括呋喃化合物和低分子量有机酸,这些物质会导致拉曼光谱中的强烈光谱重叠和荧光背景,使得提取糠醛的特征振动信息变得复杂[25,26]。在低浓度下,这个问题尤为明显,因为含有不同浓度糠醛的油样之间的光谱差异极其微妙。传统的线性量化方法,如内标校准和标准添加,依赖于单个拉曼峰的强度或面积与分析物浓度之间的线性相关性[19]。例如,Lei等人[22](2023)使用1080 cm^-1处的拉曼峰作为内标,基于糠醛浓度与其特征峰1658 cm^-1处的强度之间的对数关系建立了回归模型(R2 = 0.972)。同样,Chen等人[27](2016)应用峰面积-浓度模型预测了不同浓度梯度下变压器油中的糠醛含量,获得了0.9874的R2值。然而,这些传统的线性方法容易受到基质效应、荧光背景和仪器噪声的干扰,特别是由于它们依赖于单一光谱特征,这限制了检测的准确性和可靠性。为了提高多变量分析能力,引入了偏最小二乘(PLS)回归及其改进变体。Rajan等人[28](2016)提出了一个结合随机森林和支持向量机的机器学习框架,优化了光谱特征选择,与传统的PLS相比,将复杂基质中痕量分析物的预测误差降低了30%——这为我们的研究通过算法优化来解决油基质干扰奠定了理论基础。在另一项研究中,Li等人[29](2024)应用RF-PLS检测牛奶中的抗生素,获得了0.9648和0.9878的R2值,优于CARS-PLS和UVE-PLS等竞争方法。尽管这些变量选择的改进使R2值接近0.98,但这些模型仍然受到线性校准曲线狭窄动态范围的限制,难以捕捉光谱数据中的非线性关系。近年来,深度卷积神经网络(CNNs)在复杂光谱数据分析中表现出优越的性能[[30], [31], [32], [33]]。通过联合提取局部和全局特征,CNNs克服了单峰量化的局限性,能够检测低至10 fM的单分子浓度[30]。例如,Jiang等人[31](2023)开发了一种基于格拉姆角场图像编码的2D CNN,用于检测发霉花生中的黄曲霉素,预测误差仅为2.0 μg/kg,R2值为0.99,显著优于传统模型。Li等人[32](2024)报道了一种基于Au@Ag纳米线阵列的SERS基底,结合残差网络,实现了矿物油中苯并芘的痕量检测,R2 = 0.993,RMSE = 0.32 μg/L。同年,Chen等人[33]引入了一种由神经网络辅助的双SERS传感器,用于同时检测食品中的氯霉素和雌二醇,实现了广泛的定量(0.001–1000 μg/L),R2 = 0.976。尽管如此,大多数现有的高精度CNN基模型都是为相对简单的系统(如水溶液)设计的,它们在多组分和复杂基质(如变压器油)中的应用仍然具有挑战性[19,20,34]。主要限制包括:(1)在样本量有限的情况下存在过拟合风险,这会影响模型的泛化能力;(2)模型复杂性高,阻碍了损失函数的有效收敛;(3)由于背景噪声和多个组分之间的信号耦合,导致光谱特征提取困难。
为了解决这些挑战,本研究提出了一个通过结合改进的残差网络和基于迁移学习的校正方法来预测变压器油中糠醛浓度的框架。首先,构建了一个用4-ATP功能化的有序Au@Ag纳米线阵列,以增强糠醛的拉曼信号并使其在油基质中能够被特异性识别。然后使用DCGAN对有限的实验获取光谱进行高保真度数据增强,降低了小样本条件下的过拟合风险。随后通过移除批量归一化和池化层、嵌入Dropout正则化以及简化残差块来开发了一个改进的ResNet架构,以提高特征提取能力并降低模型复杂性。将改进的ResNet的性能与各种传统方法进行了基准测试,以评估其预测准确性和对光谱干扰的鲁棒性。为了解决加速老化样品和在役油样之间数据分布的异质性,采用了迁移学习策略。冻结了网络的较低层次,仅对深层残差块进行微调,从而构建了一个Transfer-ResNet校正框架,以增强跨域泛化。此外,引入了Grad-CAM++可解释性机制来可视化对模型预测影响最大的光谱区域。这种方法揭示了与糠醛浓度相关的关键光谱响应模式,提供了模型在定量分析过程中利用的拉曼特征的见解。