编辑推荐:
针对传统参数化量子电路模型无法处理一对多图像生成、纠缠层灵活性受限等问题,研究人员引入 Pauli-X 门作控制条件,以可重构分束器(RBS)门构建纠缠层,提出分块生成模型。实验表明,新模型在 MNIST 等数据集上余弦相似度达 0.9926,性能显著提升,为量子生成模型发展提供新思路。
在人工智能与量子计算交叉领域,图像生成技术正经历从经典到量子的革新。传统基于参数化量子电路(PQC)的生成模型虽展现潜力,却面临两大核心挑战:一是仅能实现一对一图像生成,无法满足多样化数据生成需求;二是纠缠层普遍使用无参数的 CNOT 门,导致电路灵活性受限,难以捕捉复杂数据分布。尤其在处理 MNIST、Fashion-MNIST 等多类数据集时,传统模型生成图像的多样性和逼真度不足,限制了其在计算机视觉、数据增强等领域的应用拓展。
为突破上述瓶颈,上海工程技术大学电子电气工程学院的研究团队开展了深入研究。团队围绕量子生成模型的结构优化与功能扩展,提出一种融合控制条件与新型纠缠层的一对多图像生成模型,并创新性地引入分块生成策略。相关成果发表在《Digital Signal Processing》,为量子机器学习在图像生成领域的实际应用开辟了新路径。
研究采用的关键技术方法包括:
- 参数化量子电路设计:以可重构分束器门(RBS)替代传统 CNOT 门作为纠缠层核心组件,通过引入可调参数 ω 增强电路灵活性;
- 控制条件集成:添加 Pauli-X 门作为控制信号,引导电路生成不同图像,实现一对多映射;
- 分块生成模型:将图像划分为两个子块,通过独立电路生成后组合,降低任务复杂度。
研究结果
1. 新型纠缠层的性能验证
在 MNIST 数据集的一对六生成任务中,传统电路(使用 CNOT 门)生成图像与原图的余弦相似度为 0.9691,而采用 RBS 门的新型电路将相似度提升至 0.9926。通过对比两层 PQC 的损失值发现,传统电路 A 的损失为 0.0309,新型电路仅为 0.0074,表明 RBS 门显著增强了模型对数据分布的拟合能力。
2. 控制条件对一对多生成的影响
实验表明,Pauli-X 门的引入未增加电路宽度,却有效实现了单一输入生成多模态输出。在 Fashion-MNIST 数据集测试中,模型成功生成多种类型服饰图像,验证了控制条件在引导多样化生成中的关键作用。
3. 分块生成模型的有效性
针对 CIFAR-10 数据集的复杂图像,分块生成模型将图像分割为上下两部分,通过两个独立电路分别生成后融合。结果显示,分块策略使生成图像的结构完整性和细节丰富度显著提升,证明任务分解可有效降低生成复杂度,适用于高维图像数据。
研究结论与意义
本研究通过硬件层(RBS 门)与算法层(控制条件、分块策略)的双重创新,构建了首个基于参数化量子电路的一对多图像生成模型。实验结果表明,新型模型在保持计算效率的同时,显著提升了生成图像的质量与多样性,尤其在跨数据集(MNIST 与 Fashion-MNIST 混合)任务中表现出更强的泛化能力。
该成果不仅为量子生成对抗网络(QGAN)等前沿领域提供了新的架构范式,也为解决经典机器学习中数据稀缺性问题提供了量子解决方案。未来,随着量子硬件的发展,此类模型有望在医学影像合成、自动驾驶场景模拟等领域实现突破性应用,推动量子机器学习从理论研究迈向实际生产力。
研究中提出的 RBS 门结构与分块策略,为后续量子电路设计提供了可复用的方法论,其核心思想 —— 通过参数化组件与任务分解提升模型表达能力 —— 具有跨领域借鉴价值。尽管当前研究仍基于经典 - 量子混合仿真,但其展现的性能优势已预示了量子生成模型在处理复杂数据时的巨大潜力。