《Laser & Photonics Reviews》:Phase Multiplexed Optical Computing: Reconfiguring a Multi-Task Diffractive Optical Processor Using Illumination Phase Diversity
编辑推荐:
基于衍射网络的光学计算因其低延迟、低能耗和并行性而受到广泛关注。在具备足够自由度的情况下,由空间优化表面构成的衍射网络可以在输入和输出孔径之间全光学地实现任意复值线性变换。本文报道了一种单色多任务衍射网络架构,该架构利用照明相位复用动态重构其输出功能,并实现大
基于衍射网络的光学计算因其低延迟、低能耗和并行性而受到广泛关注。在具备足够自由度的情况下,由空间优化表面构成的衍射网络可以在输入和输出孔径之间全光学地实现任意复值线性变换。本文报道了一种单色多任务衍射网络架构,该架构利用照明相位复用动态重构其输出功能,并实现大量复值线性变换。每个目标变换通过一个独特的二维照明相位轮廓(“相位密钥”)进行编码和寻址,该轮廓作用于输入孔径,从而在输出视场中激活相应的变换。一个与T个相位密钥联合优化的公共衍射网络对这些编码输入进行解复用,并执行T个变换中的任意一个。研究人员证明,具有N个优化衍射特征的网络能够为任意复输入场准确实现T个不同的复值线性变换,其中Ni和No分别指输入/输出像素数。在一项概念验证数值研究中,实现了T=512个变换,误差可忽略不计。与波长复用相比,相位复用产生的变换误差更低,从而能够实现用于计算和机器视觉的更大规模单色光学处理器。
在当今信息时代,数据的爆炸式增长和信息处理需求的不断攀升,使得高效执行大规模工作负载成为计算的核心驱动力。随着晶体管尺寸缩小达到物理极限以及片上功率密度持续增加,传统的电子数字计算在计算密度、能效和并行性方面正接近其边界。光学计算凭借其低能耗、低延迟和高度并行性,被探索用于满足激增的计算需求。通过利用光波处理信息,计算可以通过光传播的物理过程本身实现,特别是在信息处于模拟域时,有望在降低能耗的同时提高计算密度。已探索了多种光学计算架构,包括片上集成光子回路、光学超材料、衍射深度神经网络以及其他方案。作为一种新兴的自由空间计算方案,典型的D
2NN架构由多个级联的透射(或反射)衍射层组成,每层包含数万个可训练的衍射特征。在训练过程中,通过误差反向传播优化这些特征的透射/反射系数,以实现特定的计算任务。通过光与物质的相互作用,训练后的层调制入射场的相位和振幅,从而在输入和输出孔径之间全光学地执行期望的计算任务。重要的是,这些衍射层是无源光学元件,除照明光源外无需输入功率。因此,D
2NN在单次光穿过一个薄型、无源的光学体积内完成目标计算,以光的衍射极限提供并行性,具有低延迟和可忽略的能量消耗。D
2NN已在多种信息处理任务中得到验证,包括物体分类、非线性函数逼近、定量相位成像、超分辨率图像显示、信息加密、逻辑运算和通用线性变换。
本文提出了一种相位复用多任务衍射光学处理器,它利用照明相位多样性重构其输出功能,以在输入和输出孔径之间实现大量任意选择的复值线性变换。在该设计中,入射光波具有特定的相位模式,称为“相位密钥”,它们作为复用通道照射单色衍射处理器的输入孔径。这些相位密钥针对一组期望的变换/任务是可训练的,并与一个单一的解复用D
2NN联合优化。训练完成后,固定的单色D
2NN可以通过切换照明平面上的相位密钥(从一个优化模式切换到另一个)来重构其输出功能,并通用地执行任意预编程的变换。研究人员证明,当D
2NN架构的可训练衍射特征数量
N满足
N >
Ni ×
No ×
T时,每个复线性变换/函数的近似误差变得可忽略。数值上,研究人员演示了
512个独特的变换;考虑到不同应用的可接受误差范围,研究人员还表明,通过同一单色D
2NN执行的线性变换数量可以扩展到例如
~2400个。这种相位复用衍射处理器的大规模复用信息处理能力可以通过增加
N或集成额外的复用模态(如偏振和波长编码)进一步增强,从而提高整体系统吞吐量。这种可重构多任务框架广泛适用于电磁波谱的不同部分,包括可见光波段。研究人员预计,所提出的相位复用多任务衍射处理器将加速光学信息处理和机器视觉系统的发展。
**主要技术方法**
研究人员采用了一种基于衍射深度神经网络(D
2NN)的自由空间光学计算架构。核心方法包括:1. **照明相位复用策略**:为每个目标线性变换分配并联合优化一个独特的二维相位密钥,作为复用通道。2. **衍射网络联合优化**:使用随机梯度下降和误差反向传播算法,同时优化所有相位密钥和公共衍射网络层的参数(相位分布)。3. **标量衍射理论建模**:利用瑞利-索末菲衍射方程模拟光在自由空间和通过衍射层时的传播。4. **性能评估指标**:使用归一化均方误差和余弦相似度来量化全光学变换矩阵和输出场与目标值的匹配程度。
**研究结果**
**2.1 相位复用多任务衍射光学处理器的设计**
研究设计了一个相位复用光学处理器框架,由包含
N个衍射特征的级联衍射层组成。通过采用照明相位复用策略,为
T个目标变换中的每一个分配一个独特的编码相位(相位密钥),并与公共衍射处理器联合优化。训练后,相位密钥集和衍射层均被固定。研究人员构建了
T个独立的随机复值矩阵作为目标线性变换。通过训练,衍射处理器能够使用不同的相位密钥对任意复输入场准确执行相应的变换。数值结果表明,对于
T=8个通道的配置,全光学实现的复值变换矩阵与目标矩阵高度匹配,输出复场误差可忽略。
**2.2 衍射光学处理器中相位复用的可扩展性**
为了研究复用能力与性能之间的相互作用,研究人员将分析扩展到更大数量的相位复用通道。保持
Ni =
No =
16,并选择
T最大至
512。结果表明,随着复用通道数
T的增加,变换误差和输出场误差逐渐上升,但仍保持在非常低的水平。增加衍射特征数量
N的模型性能始终优于基线模型。通过数据拟合外推,在设定的误差阈值下,具有
N=64k个特征的模型预计可实现约
2400个不同的线性变换。与先前报道的波长复用宽带衍射处理器相比,在可比规模的变换数量下,相位复用单色处理器实现的误差水平要低几个数量级,突显了其优越的可扩展性。
**2.3 衍射图层有限位深对相位复用光学处理器性能的影响**
研究人员分析了衍射网络层位深这一关键参数,它显著影响其光学近似性能,并与衍射层的实际制造密切相关。研究考虑了
T=32个相位复用变换通道,并分析了具有不同
N值的两种衍射处理器设计在不同位深要求(2、4、8、12和16位)下的性能。结果显示,当位深≥
8位时,衍射处理器的变换误差变得可忽略。相反,粗量化会导致全光学变换误差急剧上升。增加衍射特征数量可以在一定程度上缓解因位深显著降低而导致的性能下降。
**2.4 相位复用衍射光学处理器中性能与衍射效率之间的权衡**
输出衍射效率是衍射光学网络的另一个关键因素,它直接影响该框架的实际适用性。影响因素包括衍射材料固有的能量吸收/反射,以及前向传播过程中光泄漏出物理孔径造成的能量损失。通过在训练损失函数中引入与衍射效率相关的惩罚项可以缓解后者。以
T=32为例,研究人员考虑了两种衍射处理器设计。结果表明,随着训练中使用的惩罚阈值增加,全光学变换的误差和实际实现的输出衍射效率都如预期增加。对于
N=64k的设计,当惩罚阈值设为20%时,优化后的衍射光学处理器实现了约
2.1×10-5和
2.3×10-5的变换误差,而实际输出衍射效率达到~23.32%。
**讨论与结论**
在讨论部分,研究人员将所提出的相位复用方法与先前的研究进行了对比。与偏振复用、旋转角复用和波长复用等方法相比,本文的相位复用单色衍射处理器实现了
512个任意复值线性变换,并可扩展至
2400个变换且误差增加可忽略。与宽带波长复用方法相比,它消除了色散和色差等限制,实现了更低的变换误差和显著的性能提升。与早期针对特定输入类别的复用架构不同,本框架独立于输入数据类别,可为任何任意复输入场执行一组预定义的任意复值线性变换。研究人员也指出了该方案的局限性,例如无法大规模并行执行多个变换(必须顺序操作),以及需要额外的光学组件或相位调制器来定制照明相位轮廓,从而增加了系统复杂性。然而,这些限制并未超过相位复用方法在变换规模和性能方面的优势。结合其他物理自由度(如偏振和波长多样性)可进一步增强复用能力并缓解部分限制。其他可能限制性能的因素,如衍射层的横向和轴向失准、表面反射和制造缺陷,可以通过先进制造技术和训练中的“接种”策略来缓解。
研究结论表明,研究人员提出了一种相位复用衍射处理器,能够利用单个单色衍射网络执行大规模、任意、复值的线性变换,该网络通过照明相位多样性重构其输出功能。这些相位复用变换由无源衍射层光学执行,除照明光外无需能量。研究人员进一步研究并量化了复用通道数
T、衍射网络位深以及这些全光学变换的输出衍射效率的潜在限制。与宽带波长复用方法相比,相位复用单色衍射处理器设计消除了色散和色差等限制,从而实现了更低的变换误差,并带来了性能上的重大改进。这凸显了相位复用在进一步提高全光学计算系统的计算吞吐量和精度方面的巨大潜力。所提出的框架可以通过将优化的衍射特征按比例缩放到照明波长,扩展到电磁波谱的其他区域,包括可见光和红外波段。