基于数据压缩神经网络的少模光纤模式信息位置无关提取方法研究

《Optics & Laser Technology》:Position-independent mode information extraction in optical fiber with a compatible data compression neural network

【字体: 时间:2025年10月26日 来源:Optics & Laser Technology 4.6

编辑推荐:

  本文针对少模光纤(FMF)模式信息提取(MIE)中传统二维图像处理方法对成像设备位置偏差敏感、计算复杂度高的问题,提出了一种基于奇异值分解(SVD)数据压缩和深度Kolmogorov-Arnold网络(DeepKAN)的位置无关MIE方法。该方法将128×128的二维光强图案压缩为512维一维向量,并利用DeepKAN实现从特征空间到模态系数的高效非线性映射。实验结果表明,即使在相机位置随机偏移达20像素的情况下,该方法仍能保持皮尔逊相关系数(PCC)超过0.9的高精度,为FMF在传感和通信系统中的实际应用提供了鲁棒高效的解决方案。

  
在当今高速发展的光通信和精密传感领域,少模光纤(Few-Mode Fiber, FMF)作为一种能够支持多个独立空间模式传输的光波导结构,正展现出巨大的应用潜力。理论上,FMF中的每个模式应具有正交的传播特性。然而,实际应用中,光纤制造过程中引入的折射率不均匀、外部弯曲、振动、机械应力以及温度变化等多种扰动,会导致模式间耦合和传输特性退化,从而影响FMF在激光器、传感器和通信系统等关键应用中的性能。
为了实时监测和补偿这些传输损伤,模式信息提取(Mode Information Extraction, MIE)技术至关重要。它能够从叠加的光场中定量表征模式耦合信息,获取模态权重和相对相位(统称为模态系数)。例如,在通信系统中,实时获取的模态失真可作为预编码的反馈信号,有效补偿经典和量子通信系统中的传输信道失真。然而,现有的MIE技术面临两大技术挑战:首先,大多数数值方法依赖于二维图像处理,严格受限于图像尺寸和计算负荷,需要在精度和速度之间进行权衡,通常处理速度慢且可扩展性有限;其次,成像设备的轻微位置偏差会导致光斑质心漂移,使得算法对光轴估计误差高度敏感,每个像素的误配准会引入约2%–4%的模态系数误差。
近年来,虽然越来越多的研究采用神经网络直接从光强分布推断模态系数,但这种数据驱动的方法仍存在模型复杂、计算负荷大以及对大规模数据集的依赖等问题。此外,基于卷积神经网络的架构通常需要超过10万个样本和大量的预训练。更重要的是,现有方法对成像位置的变化缺乏鲁棒性,这严重限制了其在动态变化环境中的实际应用。
为了解决上述挑战,北京交通大学的研究团队在《Optics》上发表了一项创新性研究,提出了一种名为DeepKAN_MIE的数据压缩方法。该方法基于Kolmogorov-Arnold表示定理,将奇异值分解数据压缩与一维神经网络架构相结合,实现了位置无关的鲁棒MIE。
本研究主要采用了几个关键技术方法:首先,通过奇异值分解将二维光强图案从128×128的矩阵压缩为512×1的一维向量,显著降低了数据量;其次,构建了兼容的一维深度Kolmogorov-Arnold网络,利用可学习的样条函数高效执行从降维特征空间到模态系数的非线性映射;最后,通过实验验证了该方法在实际MIE任务中的高精度和稳定性,实验数据来源于三种不同类型的少模光纤(包括长飞公司和OFS提供的渐变折射率光纤以及长飞公司提供的阶跃折射率光纤)构成的样本库。
2.1. 模式提取原理与预处理流程
研究人员首先从理论上分析了少模光纤中实际电场分布是所有传播的线性偏振模式线性叠加的结果。通过奇异值分解对经历随机缩放和平移的二维光强矩阵进行因式分解,提取关键特征并生成一维光场序列。由于SVD将矩阵分解为按奇异值排序的正交基分量,得到的一维特征向量捕获的是全局能量分布而非绝对空间位置,这使其对采集过程中的位置偏移天然不敏感。研究显示,仅保留前1%-5%的奇异值即可保留超过99%的信号能量,实现了有效的数据压缩。
2.2. DeepKAN架构
基于上述理论分析,研究团队引入了深度Kolmogorov-Arnold网络模型。该网络的核心概念是将激活函数从神经元节点转移到权重连接上,用可学习的单变量样条函数替代传统的权重参数。这种设计在保持数学可解释性的同时,增强了模型捕获输入数据中复杂关系的能力。网络采用六层架构[512, 256, 128, 64, 32, 5],最后一层使用sigmoid激活函数将输出限制在[0,1]范围内,直接回归每个模式的模态系数。
3.1. 仿真结果与讨论
仿真研究首先使用三模光纤验证DeepKAN_MIE算法的性能。研究人员随机生成了50,000个分辨率为128×128的光强图案,并施加随机缩放(80%-100%)和平移(最多10像素)以模拟实际场景中相机位置变化的影响。结果表明,DeepKAN_MIE在平均模态权重误差和相对相位误差方面显著优于多层感知机和基于VGG的二维卷积神经网络,平均模态权重误差为5.4e-3,平均模态相对相位误差为7.1e-3,比MLP降低了79%的测试误差。
3.2. 实验验证
实验部分通过光学测试系统验证了所提MIE方法的性能。研究使用了三种代表性光纤:两种来自长飞公司和OFS的渐变折射率少模光纤,以及一种来自长飞公司的阶跃折射率少模光纤。实验结果显示,即使在相机位置随机偏移达20像素的情况下,所有测试光纤类型的平均PCC值均超过0.9,证明了该方法对不同光纤类型和耦合条件的强泛化能力和鲁棒性。对于六模光纤的测试也取得了令人满意的结果。
研究结论表明,DeepKAN_MIE方法通过奇异值分解数据压缩和深度Kolmogorov-Arnold网络的结合,有效解决了传统少模光纤模式信息提取方法对位置敏感、计算复杂的问题。该方法将二维光强图案从16,384个元素压缩至512个元素,大幅降低了数据量,同时利用DeepKAN的可学习样条函数实现了高效的非线性映射。即使在相机引起的高达20像素的质心偏移下,该方法仍能保持PCC超过0.9的高精度,单次推理时间约为9毫秒,表现出优异的实时性能。
这项研究的重要意义在于为少模光纤模式分析提供了一种轻量级、位置无关的鲁棒解决方案,克服了传统方法在动态变化环境中的应用限制。通过将二维图像处理转化为一维特征学习,该方法显著降低了对齐精度的要求,提高了模式信息提取的稳定性和效率。这一创新为少模光纤在高速光通信、分布式传感和激光光束整形等领域的实际应用奠定了坚实基础,特别是在需要高精度模式监控和实时反馈的系统中具有重要价值。研究的成功也展示了数据压缩与新型神经网络架构结合在复杂光学系统分析中的巨大潜力,为相关领域的研究提供了新思路。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号