挖掘高阶三元相互作用:基于信息理论的生物网络调控新机制
《Nature Communications》:Mining higher-order triadic interactions
【字体:
大
中
小
】
时间:2025年11月26日
来源:Nature Communications 15.7
编辑推荐:
本研究针对复杂系统中高阶相互作用难以检测的科学难题,提出了Triadic Perceptron Model(TPM)理论框架和Triadic Interaction Mining(TRIM)算法。通过分析节点动态变量间的条件互信息变化,首次实现了对三元相互作用(即一个节点调控另外两个节点间相互作用)的系统性挖掘。在急性髓系白血病(AML)基因表达数据中的应用验证了该方法的有效性,为生物网络、生态系统和气候科学等领域的高阶相互作用研究提供了新范式。
在复杂系统的研究中,科学家们逐渐认识到许多重要现象无法用简单的成对相互作用来解释。就像社会关系中不仅存在两人之间的直接交往,还经常有第三方影响两人关系的情况一样,生物网络、神经网络和生态系统中普遍存在着一种称为"三元相互作用"的高阶调控模式。这种相互作用表现为一个节点能够调节另外两个节点之间的连接强度,从而影响整个系统的动态行为。
尽管三元相互作用在自然界中无处不在——从神经胶质细胞调节神经元间的突触传递,到生态系统中一个物种影响另外两个物种的相互作用,再到基因调控网络中调控因子影响转录因子与靶基因的结合——但科学界对这种高阶相互作用的系统性研究却相对滞后。传统的网络分析方法主要关注成对连接,而新兴的高阶网络研究也多集中于超边或单纯形结构,对于三元相互作用这种不可约简的调控模式缺乏有效的检测工具。
为了解决这一挑战,由Queen Mary University of London的Ginestra Bianconi教授领导的研究团队在《Nature Communications》上发表了题为"Mining higher-order triadic interactions"的研究论文。该研究不仅提出了一个创新的理论框架——三元感知器模型(TPM),还开发了相应的算法工具TRIM,能够从节点动态数据中有效挖掘三元相互作用。
研究团队采用了多学科交叉的研究方法,主要包括:1)构建三元感知器模型(TPM)理论框架,通过修改拉普拉斯算子引入三元相互作用;2)开发TRIM算法,基于条件互信息(MIz)的变异性检测三元相互作用;3)使用两种零模型(随机化零模型和高斯零模型)进行统计显著性检验;4)应用该算法于急性髓系白血病(AML)基因表达数据,结合人类蛋白质相互作用网络(PPI)进行生物学验证。研究利用了Grand Gene Regulatory Network Database的公开数据,确保了分析结果的可靠性。
研究团队首先建立了三元相互作用的严格数学定义。一个三元相互作用网络由结构网络和调控网络组成。结构网络GS=(V, ES)包含节点集合V和边集合ES,而调控网络GR=(V, ES, ER)是一个符号二分网络,连接节点和结构边。这种网络可以用L×N矩阵K表示,其中K?i=1表示节点i激活结构边?,K?i=-1表示抑制,K?i=0表示无调控关系。
研究团队提出了TPM模型,其中每个节点i与动态变量Xi∈R相关联。在没有三元相互作用时,网络动力学由朗之万方程描述,包含图拉普拉斯矩阵L。引入三元相互作用后,拉普拉斯算子被三元拉普拉斯L(T)替代,其元素取决于调控节点的状态。耦合常数Jij(X)采用感知器-like模型确定,根据调控节点的加权和是否超过阈值T?而在w+和w-之间切换。
TRIM算法的核心思想是:三元相互作用会导致连接节点X和Y的条件互信息MIz随着调控节点Z的值变化而发生显著变化。算法通过分析MIz(m)函数的行为来识别三元相互作用,其中m表示Z值的分位数区间。
研究团队定义了两个关键统计量来量化这种变化:Σ(MIz的标准差)和T(MIz的最大值与平均值之差)。通过与零模型比较,计算得分ΘΣ和ΘT以及相应的p值,评估每个潜在三元相互作用的统计显著性。
在10节点测试网络上的验证表明,TRIM算法能有效区分真实的三元相互作用和虚假信号。接收者操作特征曲线(ROC曲线)和精确率-召回率曲线(PR曲线)显示算法具有优异的性能,特别是在较高α值时。
扩展到100节点的随机Erd?s-Rényi网络后,TRIM算法成功识别出预先植入的25个三元相互作用,且假阳性发现率较低。当移除所有三元相互作用后,算法未检测到任何统计显著的结果,证明了其可靠性。
研究团队将TRIM算法应用于急性髓系白血病(AML)的基因表达数据,结合人类蛋白质相互作用网络(PPI)作为结构网络。该网络包含622个节点和42,511条边。为了降低计算复杂度并提高生物学相关性,研究聚焦于PPI网络最大生成树(MST)中的边,以及已知与AML相关的基因。
分析结果显示,TRIM算法成功识别出多个统计显著的三元相互作用。在排名前50的三元组中,84%包含至少一个已知与AML相关的基因。这些结果不仅包含了已知的相互作用,还提出了新的候选相互作用,为实验验证提供了目标。
这项研究首次提供了系统性的信息理论框架来建模和挖掘三元相互作用。TPM模型揭示了三元相互作用如何调节连接节点间的互信息,而TRIM算法则实现了从动态观测数据中检测这些相互作用的能力。
该研究的创新点在于突破了传统成对相互作用的分析局限,证明了标准统计量如条件互信息(CMI)对于检测三元相互作用是不充分的,必须关注条件互信息随调控节点变化的变异性。这种方法不依赖于单调性假设,能够识别非单调的调控模式,具有更广泛的应用潜力。
从网络科学角度看,这项工作为高阶相互作用的建模和推断开辟了新视角,可扩展到离散变量动力学、时间延迟调控等研究方向。从生物学角度看,研究结果启发了基因调控网络推断的新信息理论方法,为理解"三基因"过程(trigenic processes)提供了新工具。
TRIM算法的成功应用表明,信息理论方法能够有效挖掘生物网络中的高阶调控模式。未来研究可探索三元相互作用是否具有组织特异性,以及某些调控模式在不同组织中是否保守,这将为理解复杂疾病的机制提供宝贵见解。
该方法不仅适用于生物学领域,还可推广到金融、气候科学等其他存在三元相互作用的领域。随着对复杂系统理解的深入,这种基于信息理论的高阶相互作用分析方法有望成为多学科研究的重要工具,推动我们对网络调控机制的全面认识。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号