RinQ:基于当前量子计算机的蛋白质中心位点预测新框架——量子优化在残基相互作用网络中的应用与验证

【字体: 时间:2025年09月14日 来源:Materials Today Quantum

编辑推荐:

  本文推荐研究人员开发了名为RinQ的量子-经典混合框架,通过将蛋白质残基相互作用网络(RIN)中的中心性检测问题转化为二次无约束二进制优化(QUBO)形式,并利用D-Wave模拟退火求解,成功在一系列蛋白质中识别出与经典基准高度一致的关键残基,验证了该方法的准确性与鲁棒性,为量子计算在生物信息学中的应用提供了新路径。

  

在结构生物学和生物信息学领域,识别蛋白质中具有关键功能的残基——例如参与催化、构象调节或蛋白-蛋白相互作用的“热点”残基——一直是一项具有挑战性且极具价值的任务。传统的计算方法,如基于网络的中心性度量(包括度中心性、接近中心性、介数中心性和特征向量中心性等),已被广泛用于从蛋白质结构衍生的残基相互作用网络(Residue Interaction Network, RIN)中识别这些重要位点。然而,随着蛋白质体系的复杂性和规模不断增加,这些方法在计算效率和处理高维组合优化问题方面逐渐显现出局限性。近年来,量子计算技术的发展,特别是其在解决组合优化问题上的潜力,为处理此类生物网络分析问题提供了新的可能。在此背景下,Shah Ishmam Mohtashim等人开展了一项研究,旨在探索利用当前量子计算设备解决蛋白质中心残基识别问题的可行性,其研究成果以“RinQ: Towards predicting central sites in proteins on current quantum computers”为题发表在《Materials Today Quantum》上。

为了系统实现这一目标,研究人员开发了一个称为RinQ(Residue Interaction Network Quantum engine)的混合量子-经典框架。该框架的核心在于将中心残基识别问题转化为一个二次无约束二进制优化(Quadratic Unconstrained Binary Optimization, QUBO)问题。研究首先从蛋白质数据库(PDB)获取蛋白质三维结构,提取Cα原子坐标,并以8?为距离截断值构建RIN。随后,将网络表示为邻接矩阵,并分别针对特征向量中心性和Estrada中心性设计专门的QUBO形式,利用D-Wave的模拟退火采样器进行求解。此外,还采用经典方法(如NetworkX中的特征向量中心性计算和SciPy的矩阵指数函数)作为基准验证量子优化结果。该研究选取了12种不同大小和功能的蛋白质与多肽(包括胰岛素突变体1A7F、胰高血糖素1GCN、表皮生长因子1JL9、微球菌素J25 1Q71、泛素1UBQ、去氨基催产素1XY1、抗菌肽LL-37 2K6O、蜂毒肽2MLT以及多个小肽片段)进行系统测试,从计算一致性、参数敏感性、结果可解释性等多方面评估RinQ框架的有效性与稳健性。

2.1. Centrality measures

本研究聚焦于特征向量中心性和Estrada中心性两种网络中心性度量。特征向量中心性不仅考虑节点自身的连接数,还考虑其邻居节点的重要性,适用于识别全局范围内具有影响力的残基;而Estrada中心性则通过矩阵指数计算节点在所有可能路径中的参与程度,更侧重于描述残基的通信能力和网络整体紧凑性。

2.2. QUBO formulation for top-τ eigenvector centrality

通过将特征向量中心性最大化问题重新表述为QUBO形式,研究构建了一个优化目标函数,其矩阵Q由邻接矩阵A、归一化度向量d?以及约束矩阵C组合而成。该公式通过惩罚参数P0和P1分别控制中心性最大化与节点数量约束。在实际操作中,设定P0 = 1/√n,P1 = 10n,以在多数蛋白质网络中取得稳定解。

2.3. Classical computation of eigenvector centrality using NetworkX

作为对比基准,利用NetworkX库中的eigenvector_centrality()函数,基于幂迭代方法计算经典的特征向量中心性值,设定最大迭代次数为1000,收敛容差为10?6,确保结果的可重复性与准确性。

2.4. Scaling and complexity

研究还比较了不同中心性度量方法的计算复杂度:经典特征向量中心性需要O(mk)时间,其中m为边数,k为迭代次数;Estrada中心性涉及矩阵指数运算,复杂度为O(n3);而QUBO目标函数的评估仅需O(m)时间,显示出其在处理大规模网络时的潜在效率优势。

3.0.1. Data preparation

从PDB获取蛋白质结构,使用Biopython解析并提取Cα坐标,基于8?距离阈值构建残基间相互作用图。

3.0.2. Graph construction and visualization

利用NetworkX构建无向未加权图,并通过Matplotlib进行可视化,节点大小根据中心性分数缩放,直观展示关键残基分布。

3.0.3. Adjacency matrix and centrality computation

将RIN转换为邻接矩阵A,并将其用于后续的经典与量子优化计算。

3.0.4. Simulated annealing

采用D-Wave的SimulatedAnnealingSampler对QUBO模型进行求解,执行10,000次读取,温度范围β从0.1到4.0,筛选出满足∑xi = τ约束的最低能量解作为最优残基集合。

3.1. Estrada centrality

通过计算矩阵指数exp(A)的对角元素得到Estrada中心性分数,并据此对残基进行排序。

3.1.1. QUBO formulation for top-τ Estrada nodes

为将Estrada中心性纳入QUBO优化框架,研究采用三阶截断的矩阵指数近似:E = I + A + 0.5A2 + 1/6A3,并据此构建低秩矩阵E · (d? d?T) · E,最终形成QUBO矩阵。该方法的误差通过Frobenius范数进行估计,并显示其随网络密度增加而增长。

3.1.2. NetworkX implementation of Estrada centrality

利用SciPy的expm函数计算矩阵指数,并提取对角线值作为Estrada中心性的经典参考值。

3.1.3. Simulated annealing of QUBO-Estrada formulation

对Estrada-QUBO模型同样使用模拟退火进行求解,筛选出满足τ约束的最低能量解。

4.1. Proteins tested

研究共测试12种蛋白质,包括1A7F、1GCN、1JL9、1Q71、1UBQ、1XY1、2K6O、2MLT、2N08、4D5M、6A5J和6RQS,覆盖从10到76个残基的不同规模与功能类别。

4.2. Case study: Oxytocin (1XY1)

以1XY1(去氨基催产素)为典型案例,其经典特征向量中心性排名前五的残基为6、5、1、2、3;QUBO方法得到的最优解为{1, 2, 3, 5, 6},与经典结果完全一致(Jaccard指数为1.0)。Estrada中心性方面,经典方法排名为6、5、1、3、2,而QUBO方法仅识别出残基6为最重要节点。进一步通过文献比对发现,该蛋白中Tyr2、Ile3、Cys?等残基已被实验验证为与锌离子配位及受体激活有关,印证了RinQ预测的生物学相关性。

4.3. Analysis of results

综合分析所有测试蛋白发现,对于小规模、结构对称的蛋白质(如1XY1、2N08、6A5J、6RQS),QUBO方法与经典结果高度一致(Jaccard指数达1.0);而对于较大或结构不对称的蛋白质(如1UBQ、1JL9、2K6O),一致性有所下降。这表明该QUBO公式对网络拓扑较为敏感,尤其适用于规模小、结构规则的蛋白质体系。

研究结论表明,RinQ框架能够有效将中心残基检测问题转化为QUBO形式,并利用量子启发算法实现与经典方法相当甚至更优的识别效果。尽管在当前阶段,该方法在处理更大、更复杂蛋白质体系时仍面临可扩展性和解退化等挑战,但其为一类新兴的量子计算生物信息学应用提供了概念验证与实践基础。值得注意的是,该研究突出了参数选择(如P0、P1和τ)对结果稳定性的影响,并建议未来在真实量子硬件上进一步测试和优化算法表现。

讨论部分进一步展望了多个未来研究方向,包括在真实量子设备上部署算法、扩展至其他中心性度量、引入动态网络分析、开展全τ扫描以生成残基排名层级,以及结合实验数据验证预测结果的实际生物学意义。总体而言,该研究不仅为蛋白质功能残基识别提供了一种新的计算范式,也推动了量子计算在生物医学领域的应用边界,显示出其在未来结构生物学、药物设计和蛋白质工程中的潜在价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号