
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于语言模型代理的量子计算实验自动化框架:实现自主实验操作与闭环反馈控制
【字体: 大 中 小 】 时间:2025年09月24日 来源:Patterns 7.4
编辑推荐:
为解决量子计算实验中参数校准复杂、人工依赖度高的问题,研究人员开发了基于语言模型代理的"k-agents"框架,实现了多步骤量子实验的自主规划、执行与分析。该系统在超导量子处理器上成功完成了单比特/双比特门校准和GHZ态制备等复杂实验,性能达到专家水平,为实验室自动化提供了可扩展的新范式。
在量子计算研究领域,超导量子处理器已成为最有前景的平台之一,近年来其规模已扩展到数百个量子比特。然而,随着系统复杂度的增加,校准数百个量子比特的操作参数已成为一个重大瓶颈。传统实验自动化方法需要人类专家将知识转化为机器可执行的代码,但由于实验装置日益复杂,操作所需的技术细节更加精细,这种知识转换和维护的一致性需要大量人力投入,反而削弱了自动化带来的效率提升。
实验室知识通常具有多模态和复杂特性,很难开发出能与人相媲美的自动化程序。大型语言模型(LLM)和多模态LLM的出现为实验自动化带来了新希望,因为它们具有处理文本和图像信息的通用能力。然而,大多数承载实验室知识的媒体(如代码和文档)都是专有的,无法在线获取,这意味着它们不太可能包含在公开LLM的训练数据中。此外,包含此类专业实验室知识的文本数量通常不足以有效微调LLM。
针对这些挑战,牛津大学和多伦多大学的研究团队在《Patterns》期刊上发表了一项创新研究,提出了名为"k-agents"的知识型多代理系统框架,专门用于自动化需要大规模多模态实验室知识和复杂工作流的实验。该系统在超导量子处理器上成功演示了单比特和双比特门校准以及GHZ态制备等复杂实验,性能达到专家研究人员水平。
研究人员采用的关键技术方法包括:1)基于语言模型的知识代理架构,包含代码翻译代理、过程翻译代理和检查代理;2)代理型状态机机制,将复杂实验流程分解为独立实验阶段;3)基于嵌入相似性的代理激活机制,实现高效知识检索;4)多模态结果分析系统,结合文本和图像处理能力。实验在一台16量子比特的超导量子处理器上进行,重点关注相邻三个量子比特的子集。
知识代理设计
研究团队定义了"知识代理"作为系统的核心组件,这些代理能够接收和传递知识。代码翻译代理负责将自然语言指令转换为可执行代码,每个代理都从实验类直接构建。过程翻译代理则能够基于存储的示例将指令转换为对应的实验流程。检查代理具备分析实验结果所需的知识,特别是在需要分析图表以评估实验成功与否并确定后续步骤的场景中。
执行代理工作机制
执行代理负责协调知识代理和管理复杂实验流程。该代理以自然语言编写的实验流程作为输入,首先将程序分解为"状态机",每个状态代表程序的一个独特实验阶段。每个实验阶段都分配有只包含一个实验或子程序的单一指令,同时还包含用自然语言编写的转换规则,用于根据实验结果选择下一阶段。
在超导量子处理器上的应用
研究人员将k-agents框架应用于超导量子处理器的校准和操作。超导电路为构建量子信息处理器提供了一个流行的物理平台,这些电路使用纳米制造技术在芯片上制造,在毫开尔文温度下遵循量子力学原理运行,形成非线性量子谐振器。
系统成功完成了三个关键实验:单量子比特参数的全自动重新校准、双量子比特门参数的自动发现和校准,以及基于自然语言描述的量子态生成。在单量子比特校准实验中,执行代理成功将程序分解为校准和基准测试两个不同阶段,校准阶段进一步分解为多个步骤,代理依次调整量子比特的频率、幅度和DRAG(derivative removal by adiabatic gate)参数。
在双量子比特门参数发现实验中,研究人员专注于siZZle(Stark-induced ZZ by level excursions)门,该门可用于在两个固定频率超导量子比特之间创建纠缠。通过同时以相同频率非共振地驱动两个量子比特,量子比特哈密顿量中的ZZ项相比未驱动时会发生改变。利用这种效应,研究团队构建了具有校准幅度和频率的脉冲序列来调整ZZ相互作用强度,然后通过精细调整脉冲持续时间来实现精确的量子比特纠缠。
在GHZ态制备实验中,执行代理成功执行了基于自然语言指令的实验,在成功校准门参数后,代理进行了态层析以验证GHZ态,并报告了态保真度。
性能基准测试
在硬件演示之前,研究人员首先在超导量子比特背景下对k-agents进行了性能基准测试。翻译过程的测试结果显示,GPT-4o模型具有最佳性能,准确率达到97%,被认为足以满足实际应用。检查代理的评估表明,使用示例图构建的检查代理能够最准确地识别实验的成功与失败。
研究意义与创新点
这项研究引入的k-agents框架在几个重要方面区别于先前的方法:首先,它专门为量子计算实验室设计,实验自动化涉及分解长视野工作流并通过分析先前结果动态调整参数化实验;其次,该系统在不依赖大规模互联网语料库的情况下有效运行,使其更适合实验室环境;此外,该系统通过构建在现有实验室代码库上强调实际应用。
与基于规则的系统、强化学习和贝叶斯优化等方法相比,k-agents框架具有根本性差异。该框架旨在自动化整个实验流程,而不仅仅是调整特定参数。优化方法如强化学习和贝叶斯优化通常需要大量手动调整和精心设计的奖励函数,并且仅限于狭窄的预定义任务。相比之下,该框架提供了一个更通用、可解释和适应性强的解决方案,特别适合动态和不断发展的量子实验室环境。
该框架的知识表示方法不需要比维护标准实验室文档更多的努力,并且自然适合常规协议管理。虽然采用任何新框架都需要一些入门和培训,但设置工作量与为新的博士生或初级员工准备实验室手册或协议相当。一旦标准文档存在(这在大多数实验室中是常见做法),我们的代理可以用最少的额外工作进行配置。
局限性与未来方向
k-agents框架也存在一些潜在弱点,使得完全自动化具有挑战性。首先,该方法依赖于干净且格式良好的代码库和流程文档。然而,这种结构化知识可能并不总是存在,转换现有知识可能需要大量人力。未来关于非结构化文档和代码库结构化的研究仍然需要完全自动化知识转换。一个可能的研究方向是使框架能够基于非结构化项目文件和人类输入生成结构化代码和流程。
其次,使用LLM时,k-agents的执行表现出比传统自动化方法更高的延迟,传统方法不需要基于LLM的规划和运行时知识翻译。作者指出,通过缓存LLMs的响应并在输入相同时使用相同响应,可以很好地缓解这个问题。
此外,当前在基于代理的状态机内执行代理的实现不支持细粒度、可中断的执行;它只允许响应外部信号或紧急条件终止整个程序。然而,作者承认在量子系统中,为人类科学家提供监控和干预实验进度的交互机制可能是有益的。解决这一限制是未来发展的优先事项,团队计划探索集成实时中断机制、硬件级钩子和人在环路安全协议。
在成本方面,在双量子比特门参数搜索期间,研究人员观察到LLM在3小时内使用了1,373,207个输入令牌(包括图像令牌)和168,039个输出令牌,成本低于5.00美元。他们认为还有进一步优化以降低这些成本的潜力。
这项研究为在超导量子处理器上研究的研究小组提供了一个有价值的工具,并具有在其他领域的研究自动化中更广泛应用的潜力。通过实现智能协调和复杂实验室环境中的决策,这种方法为实验科学中更灵活、可扩展的自动化铺平了道路。
生物通微信公众号
知名企业招聘