
-
生物通官微
陪你抓住生命科技
跳动的脉搏
面向片上光子神经网络推理的扩展策略:部分相干深度光学神经网络(PDONN)的集成实现与性能验证
【字体: 大 中 小 】 时间:2025年09月18日 来源:Light-Science & Applications 23.4
编辑推荐:
为解决片上光学神经网络(ONN)在网络深度和输入尺寸扩展方面的关键瓶颈,研究人员开展了基于部分相干光源与光电非线性激活的深度光学神经网络研究。他们提出并实现了部分相干深度光学神经网络(PDONN)架构,通过光电转换非线性激活函数实现正净增益的级联扩展,利用卷积层实现快速降维,并采用部分相干光源降低对窄线宽激光器的依赖。实验结果表明,该集成芯片在64输入规模下实现了96%(二分类)和94%(四分类)的端到端推理准确率,显著推动了高能效、可扩展光学计算系统的发展。
光学神经网络(Optical Neural Networks, ONNs)近年来被视为突破传统电子计算能效瓶颈的重要技术路径。其利用光传播的低能耗特性与高带宽优势,在人工智能计算领域展现出巨大潜力。然而,要实现真正的端到端光学推理,仍面临两大核心挑战:一是光学非线性激活函数(Nonlinear Activation Functions, NAFs)的级联能力弱,难以构建深层网络;二是片上光学矩阵的规模受限于集成密度与光源相干性要求,制约了输入尺寸的扩展。以往研究往往依赖外部电放大器或复杂相干检测方案,不仅增加了系统复杂度,也限制了计算效率与可扩展性。
针对上述问题,武汉国家光电研究中心Bo Wu、Chaoran Huang等研究人员在《Light-Science & Applications》上发表了一项突破性研究,提出了一种名为“部分相干深度光学神经网络”(Partially Coherent Deep Optical Neural Network, PDONN)的扩展策略,并成功实现了单片集成的多层级联光学计算芯片。该工作首次在同一个芯片上集成了输入层(64单元)、两个卷积层和两个全连接层,是目前报道中输入规模最大、光学层数最多的片上光学神经网络。
在关键技术方法方面,作者采用了一套高度集成化的硅光子工艺平台,包括基于载流子注入的强度调制器(IM)、微环调制器(MRM)实现非线性激活、简化型MZI(Mach-Zehnder Interferometer)网格实现全连接层计算,并创新性地引入部分相干光源(如LED或ASE源)替代传统窄线宽激光器。通过原位训练(in-situ training)方法优化热相位调制器电压,系统具备对制造误差和环境扰动的强鲁棒性。
研究结果部分主要包括以下几个方面:
Principle of the PDONN chip
PDONN的数学架构基于标准卷积神经网络(CNN),输入图像(8×8像素)经卷积核(2×2)步幅2卷积后尺寸降为4×4,再通过两个全连接层输出分类结果。光学实现上,输入光通过强度调制器编码,卷积层通过MZI分光与差分光电检测实现实值点积运算,其输出电流驱动MRM产生类Sigmoid非线性响应。全连接层采用定制化4×8 MZI矩阵与多端口光电探测器结合,同样通过MRM实现非线性转换。
Chip fabrication and characterization
芯片采用130 nm CMOS工艺线制备,集成数百个光学器件于17 mm2芯片上。实测表明,强度调制器带宽达22 MHz,调制效率为0.125 dB/mA。系统单次推理延迟为4.1 ns,其中非线性激活RC延迟约占1.67 ns。非线性函数在输入光功率充足时可实现正净增益,证实了其级联能力。
Image classification results
在MNIST手写数字四分类任务中,实值ONN准确率达95%(训练集)和87%(测试集),显著优于仅使用正权值的ONN(73%和68%)。使用0.4 nm线宽的部分相干光源时,准确率仍保持在94%与90%,证明其在对相干性要求宽松的场景中仍具备优异性能。
The multiplexing technology of the PDONN
研究进一步提出波长复用架构,通过波分复用(WDM)技术将不同波长通道分配至不同光学层,利用部分相干光源的宽带特性提升系统并行度与计算容量。
Key performance comparison of different ONNs
与现有ONN方案相比,PDONN在输入规模(64)、光学层数(4)、光源兼容性(部分相干)和操作域(实值)等方面均具备显著优势。其能效为121.7 pJ/OP,在未充分优化的情况下已接近主流方案水平。
本研究通过光电转换非线性激活函数、卷积降维结构与部分相干光源的协同创新,成功实现了可扩展、高能效的片上光学神经网络架构。PDONN不仅显著提升了端到端光学推理的可行性和实用性,还降低了对昂贵窄线宽激光器和复杂检测系统的依赖,为大规模光学人工智能计算系统的实用化奠定了关键技术基础。该工作被评价为“向着实现能源高效、可扩展且广泛可用的光学计算迈出的关键一步”。
生物通微信公众号
知名企业招聘