
-
生物通官微
陪你抓住生命科技
跳动的脉搏
通用神经符号回归工具LLC:揭示复杂网络动态的可解释性规律
【字体: 大 中 小 】 时间:2025年07月07日 来源:Nature Communications 14.7
编辑推荐:
本研究开发了一种名为LLC(Learning Law of Changes)的通用神经符号回归工具,通过结合深度学习的强大拟合能力和预训练符号回归的方程推理能力,自动高效地从复杂网络动态数据中学习可解释的微分方程。研究人员在物理、生物化学、生态学和流行病学等领域的十余个代表性场景中验证了该工具的有效性,相比现有最先进的符号回归技术,LLC能更准确地发现网络动态的支配方程,并在全球疫情传播和行人运动等实际系统中展现了应用潜力。这项工作为揭示复杂现象背后的隐藏机制提供了通用解决方案。
在探索复杂系统奥秘的征程中,科学家们一直试图揭示支配网络动态变化的基本规律。从中国古代的《易经》到西方的辩证思维,"变化是唯一永恒"的哲学思想贯穿始终。然而,面对复杂网络系统中海量的节点和维度,传统方法在推断支配方程时面临着"维度灾难"和计算效率低下的双重挑战。现有技术要么需要大量先验知识设定函数项,要么依赖耗时的遗传编程搜索,难以平衡专家知识与计算成本的关系。
针对这一难题,中国的研究团队开发了一种名为LLC(Learning Law of Changes)的创新工具。这项发表在《Nature Communications》上的研究,通过巧妙结合深度神经网络与预训练符号回归模型,实现了对复杂网络动态方程的高效、自动发现。研究人员首先利用物理先验将网络动态信号解耦为自身动态(Q(self))和交互动态(Q(inter)),通过神经网络拟合这些分量;然后采用预训练的符号回归模型NSRA快速解析出可解释的方程形式。这种方法不仅大幅降低了问题的维度,还显著提高了方程发现的效率。
关键技术方法包括:(1)基于物理先验的网络动态信号解耦技术,将高维问题转化为学习d维和2d维函数;(2)采用Savitzky-Golay滤波器和五点差分法计算数值导数;(3)使用K-Means采样策略提高预训练符号回归模型的效果;(4)结合验证集误差和预测差异的双重终止条件。
研究结果显示,在一维同质网络动态(如生化、基因调控、互惠相互作用等场景)中,LLC的预测调整R2分数和方程召回率均显著优于TPSINDy和GNN+GP方法。特别是在处理多维系统如FitzHugh-Nagumo神经元动力学时,LLC能准确捕捉膜电位(Xi,1(t))和恢复变量(Xi,2(t))的准周期特性。对于异质系统如捕食者-被捕食者模型,LLC无需预先定义交互项形式就能发现更接近真实动态的方程。
在混沌系统测试中,LLC表现出色。无论是Lorenz系统还是Rossler系统,从不同初始条件推导出的方程都能在1000个时间步长内准确预测系统行为。通过Poincaré截面法绘制的分岔图显示,LLC发现的方程与真实方程具有相同的周期倍增和混沌现象。这证实了该工具在分析未知动力学系统复杂行为方面的潜力。
实际应用测试更具说服力。在全球COVID-19传播数据上,LLC推导出的方程强调了自身动态的主导作用,并发现交互项与生态系统中的互惠动力学相似。与主流社会力模型相比,LLC在行人运动数据中发现的方程更符合"领地效应"的实际情况。
这项研究的突破性在于:首次将预训练模型引入网络动态方程发现领域,解决了高维自由变量和符号推理效率两大难题;通过物理先验引导的信号解耦,实现了对复杂网络动态的有效降维;在十余个跨领域场景中验证了工具的通用性,包括同质/异质系统、混沌系统等复杂情况。研究人员开发的LLC工具如同一个"数值培养皿",帮助科学家透过数据迷雾洞察复杂系统背后的动态规律。
尽管该工具展现出强大潜力,作者也指出了一些待解问题:如何获取底层拓扑结构仍具挑战性;外部时变干扰的处理超出当前研究范围;更高阶的网络交互和非确定性系统等更复杂场景需要进一步探索。这些方向也为未来研究提供了思路。总体而言,这项工作为分析复杂系统提供了一种可解释、高效的新方法,在应对新发传染病和气候变化等全球性挑战方面具有重要应用前景。
生物通微信公众号
知名企业招聘