《Advanced Intelligent Systems》:Identifying Dynamical Quantum Phase Transitions With a Migratable Quantum-Classical Hybrid Neural Network
编辑推荐:
机器学习的最新进展极大地促进了平衡态量子相和量子相变的研究。当应用于动力学现象时,由于包含了时间维度,经典和量子网络都需要大量的资源成本。在此,研究人员提出了一种混合量子-经典架构,将量子卷积神经网络(QCNN)与经典神经网络(CNN)相结合,用于研究非平衡动
机器学习的最新进展极大地促进了平衡态量子相和量子相变的研究。当应用于动力学现象时,由于包含了时间维度,经典和量子网络都需要大量的资源成本。在此,研究人员提出了一种混合量子-经典架构,将量子卷积神经网络(QCNN)与经典神经网络(CNN)相结合,用于研究非平衡动力学,并展示了其在分类动力学量子相变(DQPT)中的应用。该混合网络的QCNN层负责在每个时间步从量子态中提取空间特征,而CNN层则处理QCNN输出的时间序列以进行分类。对于最近邻横场伊辛模型,数值模拟显示在识别淬火动力学中的DQPT时测试准确率超过95%,并且在单比特和两比特退极化噪声下具有鲁棒性。值得注意的是,经过训练的网络无需修改即可应用于具有长程相互作用的不同伊辛模型,展现了其作为可迁移分类器的潜力。该混合框架规避了经典方法的指数级成本以及深量子电路对噪声的敏感性,为表征非平衡动力学提供了一种可扩展且硬件高效的方法。
**论文解读:可迁移量子-经典混合神经网络识别动力学量子相变**
**研究背景与问题**
机器学习在平衡态量子多体系统的研究中已取得显著进展,通过经典或量子神经网络可以高效分类量子相与量子相变。然而,当处理动力学现象(如淬火过程)时,时间维度的引入使得经典方法(如量子态断层扫描或阴影测量)需要指数级增长的资源,而纯量子方法(例如直接堆叠时间点形成大输入态或使用历史态编码)则对近期含噪声中等规模量子(NISQ)器件提出苛刻要求——需要大量量子比特或深变分线路,且易受噪声干扰。因此,亟需一种既能降低资源消耗又具有噪声鲁棒性的方法,用于表征非平衡动力学中的关键现象,例如动力学量子相变(DQPT)。DQPT是体系在淬火后Loschmidt回声率函数出现非解析点的现象,传统上依赖间接测量或数值模拟提取特征,难以直接利用时间依赖的量子态进行训练。
**研究内容与结论**
研究人员提出一种混合量子-经典架构,将量子卷积神经网络(QCNN)与经典神经网络(CNN)结合,用于分类DQPT。在该框架中,QCNN重复处理不同时间步的瞬时量子态,仅需O(log N)个量子比特和O(poly(log N))个变分参数,提取空间特征;CNN(全连接网络FCNN或双向长短期记忆网络LSTM)则处理QCNN输出的时间序列,捕捉时间演化模式。通过在最近邻横场伊辛模型(TFIM)上监督训练(仅36个淬火样本经数据增强),对10个自旋体系的2450个测试样本,测试准确率超过95%(QCNN-FCNN达96.3%,QCNN-LSTM达96.5%),且对高达0.01的两比特退极化噪声具有鲁棒性。更关键的是,训练好的网络可直接用于长程相互作用TFIM(基于24个自旋、开放边界条件),其预测的相图与Loschmidt回声的最小值吻合,展现出可迁移性。该工作发表于《Advanced Intelligent Systems》。
**主要关键技术方法**
研究人员采用以下关键技术:(1) **量子卷积神经网络(QCNN)**:由参数化卷积层(两比特纠缠门)和池化层(局部求迹)组成,对每个时间步的瞬时量子态进行空间压缩,最终输出单比特的期望值序列;(2) **经典神经网络(CNN)**:分别使用全连接网络(FCNN)和双向LSTM(Bi-LSTM)处理QCNN输出的时间序列,后者专为捕获时序依赖设计;(3) **变分量子本征求解器(VQE)与Trotter分解**:制备初始基态并模拟动力学演化,样本来源包括最近邻TFIM(10个自旋、周期性边界条件,36个淬火样本,每个演化300个时间点经增强为108个输入序列)和长程TFIM(24个自旋、开放边界条件,2500个参数点);(4) **联合训练**:QCNN参数与CNN权重通过二进制交叉熵损失函数和Adam优化器端到端优化,梯度计算采用自动微分或参数平移法则。
**研究结果**
**3 Benchmark on Nearest-Neighbor TFIM(最近邻TFIM基准测试)**
研究人员在最近邻横场伊辛模型上验证框架性能。通过数值模拟淬火动力学(初始态为|0?或GHZ态),将Loschmidt回声最小值作为DQPT标记,构建监督二分类。训练后,QCNN-FCNN和QCNN-LSTM在测试集上分别达到96.3%和96.5%准确率(初始态为|0?时)及94.9%和97.1%(初始态为GHZ时)。QCNN输出的单比特测量序列〈σ
z〉在存在DQPT与无DQPT的相区呈现明显不同的均值、方差和时间结构,表明QCNN成功提取了与Loschmidt回声等效的局部特征。
**4 Generalization to Long–Range Interactions(泛化至长程相互作用)**
将已训练(基于最近邻模型)的QCNN-LSTM网络直接应用于长程TFIM(哈密顿量含幂律衰减耦合,采用Kac归一化),无需微调。预测的相图与数值模拟的最小Loschmidt回声(min|L|)高度一致,且在极限情况(α→0)下临界点与热力学极限理论预测相符。该结果证明QCNN能从局部〈σ
z〉测量中提取对DQPT具有普适性的特征,而无需全局Loschmidt回声,实验上更易实现。
**5 Robustness to Quantum Noise(对量子噪声的鲁棒性)**
在存在两比特退极化噪声(噪声概率p
2)和附加单比特噪声(p
1=0.1p
2)的条件下测试性能。对最近邻TFIM,当p
2≤0.01时两种架构仍保持高分类准确率(>90%);随噪声增加性能下降,FCNN略优于LSTM。该结果表明混合架构对中等噪声水平具有鲁棒性,适用于NISQ实验环境。
**总结讨论**
研究人员在结论部分指出,所提出的混合量子-经典神经网络具有四大优势:(1) QCNN层压缩量子信息,资源需求随系统尺寸对数增长;(2) 通过重复使用QCNN处理不同时间步,避免了对量子资源的高昂需求;(3) 可直接接收量子模拟器的输出,无需完整态重构;(4) 一旦在完美量子比特操作下训练完成,可无修改地应用于相似模型,并容忍中等量子噪声。
**研究结论**:提出了一种用于分类动力学量子相变的混合量子-经典神经网络。通过将QCNN与不同经典网络结合,该方法能从演化量子态中高效提取时间特征并准确预测DQPT。该框架在短程和长程横场伊辛模型上均取得满意性能,为表征非平衡动力学提供了可扩展且硬件高效的途径。