非平衡生物物理过程的计算表达能力限制及其在生物信息分类中的突破

【字体: 时间:2025年08月06日 来源:Nature Communications 15.7

编辑推荐:

  本研究针对生物系统如何在高维化学状态下进行分类决策这一核心问题,通过马尔可夫跳跃过程(Markov jump processes)抽象生化网络,揭示了非平衡生物物理过程在分类能力上的根本性限制。研究人员发现这些限制源于非平衡热力学约束,但可通过"输入多重性"(input multiplicity)机制克服,该发现为理解细胞信息处理提供了新范式,相关成果发表于《Nature Communications》。

  

在复杂的生命活动中,细胞需要不断对高维化学信号进行分类决策——从简单的二元选择(如代谢开关)到复杂的多状态识别(如糖基化编码)。然而,这些精密的信息处理能力背后隐藏着一个根本性谜题:受限于热力学定律的生化系统,如何实现堪比人工神经网络的计算复杂度?这个谜题的核心在于理解非平衡生物物理过程的计算表达能力(computational expressivity)边界。

芝加哥大学(University of Chicago)的研究团队通过建立马尔可夫跳跃过程(Markov jump processes)的理论框架,揭示了生物分子网络作为信息处理器的基本限制。研究发现,这些限制源于非平衡热力学的基本约束,但可以通过生物系统中普遍存在的"酶多靶点作用"等机制突破。这项突破性工作不仅解释了细胞如何实现复杂分类,更为合成生物学设计提供了新思路,相关成果发表在《Nature Communications》。

研究人员主要采用三项关键技术方法:(1)基于矩阵树定理(matrix-tree theorem)的稳态概率解析计算;(2)输入多重性(input multiplicity)参数化建模,通过调节单个输入变量驱动的边数(M)来量化表达能力;(3)互信息优化算法评估分类性能,使用Fletcher-Reeves共轭梯度法优化网络参数。实验验证采用15节点25边的随机马尔可夫网络模型,通过数值模拟分析不同M值下的分类表现。

分类任务中的马尔可夫跳跃过程

研究将生化网络抽象为具有Nn节点和Ne边的马尔可夫状态网络,输入变量Fa通过调节特定边上的跃迁速率Wij = eEj-Bij+Fij/2+Fa/2来影响系统。稳态分布π(F;θ)作为输入的函数,执行分类计算。通过矩阵树定理的两种等价表述——有理多项式形式和线性注意力形式,揭示了网络的计算本质。

非平衡热力学的基本限制

研究发现单调性约束(monotonicity constraint)导致分类能力受限:对于固定参数θ,任何输出节点概率πk(Fij)都是输入Fij的严格单调函数。如图3所示,这使得网络无法学习旋转对称的决策边界。数值实验表明,在M=1(单输入单边驱动)时,网络能解决简单线性分类(图3A-B),但无法处理需要非单调响应的任务(图3C)。

输入多重性提升表达能力

当M>1时(如酶同时调控多个靶点),单调性约束被打破。理论分析表明,对于D=1维输入,转折点数量R从M=1时的0个增至M>1时的(2M-1)个(图3E)。VC维度分析进一步证实,分类能力上限随M呈指数增长:NVC ≤ (2M+1)D。实验证明,M=2时原失败任务(图3C)可被成功解决(图3F),这与合成生物学中设计的双通路药物响应系统(图3G)原理一致。

多类分类的存储能力

研究揭示了系数ζμi(θ)间的等式约束会限制分类自由度。对于M=1,D=2的情况,可用自由度nd.o.f. = min(2Ne, 3Nn)不足以满足四类分类的4Nn个不等式条件(图4A-B)。增加至M=2后,网络成功实现四类分离(图4C),这为理解免疫识别和糖基化编码等高维分类提供了理论基础。

μi(θ)函数的约束关系,C展示M=2时的成功分类。'>

非平衡驱动的必要性

通过比较Fij和Bij两种输入模式,研究发现非平衡参数Fij对表达能力至关重要。如图5所示,分类准确率随最大驱动力Fmax单调增加,表明平衡态系统(Fij=0)无法实现复杂计算。互信息优化实验(图6)进一步证实,M=2时系统能区分三峰分布(互信息≈1.5比特),接近理论最大值1.58比特,且自发形成类似one-hot的编码策略。

决策边界的锐度调控

研究比较了串/并联扩展对决策边界锐度的影响(图7)。理论推导出锐度上限|?πS/?F| ≤ MR/8,其中MR为输出节点生成树的最大驱动力范围。串联扩展(图7C)使MRO ~ n增长,而并联扩展(图7B)保持MRO恒定,这解释了为何多步动力学校对(kinetic proofreading)和协同结合需要串联驱动机制。

S(F=0)随n的变化。'>

这项研究建立了非平衡生物物理系统计算表达能力的普适理论框架,揭示了输入多重性在突破分类限制中的核心作用。与人工神经网络中深度增加提升表达能力类似,生物系统通过调控酶的多靶点作用等机制,可能实现分类能力的指数级提升。发现不仅解释了糖基化编码、免疫识别等复杂生物信息处理现象,更为合成生物学设计高性能分子 classifier 提供了理论指导。特别地,研究提出的矩阵树定理形式与transformer架构的相似性,暗示了生物计算与人工智能间可能存在的深刻联系。

研究同时指出,密集互连的网络拓扑会通过生成树权重纠缠限制锐度,这为理解生物网络设计原则提供了新视角。未来工作可将此框架拓展至非线性反应网络,并与信息论方法结合,全面揭示生物系统在噪声环境下的最优决策机制。这些发现将推动从基础理论到合成生物学应用的跨学科研究,为理解生命如何利用物理约束实现智能计算树立了新范式。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号