编辑推荐:
为解决光子拓扑绝缘体(PTI)结构参数逆向设计难题,中国计量大学和江南大学等研究人员开展了基于串联残差神经网络的谷霍尔 PTI 逆向设计研究。结果表明该方法有效,能实现低损耗波导等更多光子器件设计,为 PTI 多模态逆向设计提供了新途径。
研究背景
在光子学领域,随着光子量子霍尔效应的发现,光子拓扑绝缘体(PTI)的研究变得愈发重要。PTI 能在无磁场的情况下模拟电子系统中的量子霍尔效应,产生拓扑保护的边缘态。这些边缘态已在拓扑激光器、光波导、调制器和通信组件等多种器件中得到应用。
然而,目前在 PTI 的实际应用中,结构参数的逆向设计面临诸多挑战。传统解决光子领域逆向设计问题的方法,如拓扑优化、自动微分、遗传算法、模拟退火和粒子群优化等,虽然能逐渐接近最优结果,但往往效率不高,在处理复杂高维数据关系时也力不从心。近年来,深度学习方法虽为逆向电磁问题提供了新思路,但也存在不同光子结构可能有相似电磁响应,导致传统神经网络预测误差的问题。因此,开发更高效、准确的 PTI 逆向设计方法迫在眉睫。
研究团队与研究内容
为解决上述问题,中国计量大学和江南大学等机构的研究人员开展了深入研究。他们提出了一种由六边形晶格空心三角杆构成的谷霍尔 PTI,并构建了两个包含残差块的串联残差深度神经网络,用于 PTI 的多模态逆向设计。
研究方法
- 构建数据集:研究人员通过有限元法(FEM)快速计算,生成了 6000 组结构参数(d1、d2、θ、ε )对应的光子带和中心频率、带隙比((f,g) )数据样本,以及相关晶格图像,作为训练模型的数据集。
- 搭建神经网络模型:利用 PyTorch 搭建深度学习模型,包括串联多层感知器(MLP)和基于变分自动编码器(VAE)的复合串联网络。其中,串联 MLP 用于从目标(f,g) 反推结构参数值;复合 VAE 网络则根据(f,g) 重建 PTI 晶格样本图像。训练过程中设置了合适的学习率、批量大小和损失函数,并进行多轮训练14。
- 模拟验证:使用 Comsol Multiphysics 软件进行模拟,通过计算光子带结构、边缘波导传输特性等,验证逆向设计结构的有效性。
研究结果
- 谷霍尔 PTI 模型:所提出的二维 PTI 由排列在六边形晶格单元中心的空心三角杆组成。通过 FEM 计算扫描第一布里渊区边缘,得到其光子带结构。发现特定带隙 PBG 1 具有拓扑谷霍尔相,可通过谷陈数表征,研究人员选择 PBG 1 作为后续逆向设计的目标带隙23。
- 基于串联 MLP 网络的逆向设计(方法 1):构建的串联 MLP 由 Model A 和 Model B 组成。Model A 用于拟合 PBG 1 的两个属性((f,g) )与形成 PBG 1 的两个带的 58 个本征频率之间的映射函数;Model B 则根据这些本征频率预测 PTI 的结构参数。训练后,该模型在测试集上预测结构参数的准确率可达 99.70%,总网络准确率为 98.85%,优于传统串联网络和双校验网络15。
- 基于复合 VAE 网络的逆向设计(方法 2):复合网络由 VAE 和 ResMLP 构成。其中 Model A 与方法 1 中的相同,Model B 用于从给定的带推断样本图像的潜在特征,Model C 为 VAE 的解码器,用于从潜在特征重建晶格图像。训练后,该模型在测试集上预测带的准确率达到 98.6%,预测(f,g) 的准确率为 97.5%46。
- 逆向设计的拓扑保护传输验证:研究人员分别使用方法 1 和方法 2 设计具有特定 PBG 的谷霍尔 PTI。对于任意设定的目标中心频率 0.48 THz 和带隙比 25%,两种方法设计的晶格结构计算得到的带都与目标带接近。将逆向设计的 PTI 结构用于构建拓扑保护边缘波导,通过全波模拟发现,在工作频段内,直波导和 120° 转弯波导的传输率均高于 98%,且背向散射大大抑制78。
研究结论与意义
本研究提出的空心三角杆型 PTI 及基于串联残差神经网络的多模态逆向设计方法具有重要意义。串联网络中的残差连接加速了训练收敛,避免了梯度消失问题;tanh 激活函数保证了逆向设计结构的有效性。与传统方法相比,该方法在训练速度和预测准确性上表现更优,且能提供多模态结果。研究结果表明,基于深度学习的逆向设计方法可有效实现低损耗波导等更多光子器件的设计,为 PTI 及其他光子器件的设计开辟了新道路,推动了光子学领域的发展。但该研究也存在一定局限性,如未研究以最大化带隙为目标的结构参数优化,方法的通用性受限于新数据集的需求,逆向设计的拓扑波导还需实验进一步验证其实际有效性。未来研究可针对这些不足展开,进一步完善相关技术和应用。