
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于热核动态演化的图序列分类方法及其在分子网络与社交网络中的应用
【字体: 大 中 小 】 时间:2025年06月21日 来源:Expert Systems with Applications 7.5
编辑推荐:
针对静态图模型难以捕捉系统动态演化特征的难题,研究人员提出Heat Kernel based Graph Evolution方法,通过热扩散机制将静态图转化为动态序列,结合Graph Dynamic Time Warping(GDTW)对齐非线性时序差异,构建Evolutionary Kernel分类器。实验显示,该方法在MUTAG、IMDB-Binary等数据集上准确率提升0.3-31.8%,为图分类提供了兼顾静态与动态特征的新范式。
在工业信息学和社交网络分析中,图(Graph)作为描述复杂系统的基本工具,其节点和边能够直观刻画个体间的交互关系。然而,现实世界的分子网络(如Debnath等研究的药物分子网络)和社交网络(如Brask等分析的动物群体网络)本质上是动态演化的系统,传统静态图模型仅能捕捉某一时刻的快照,难以反映由热核(Heat Kernel)驱动的信息扩散过程所决定的几何演化特征。这一局限性导致现有图分类方法(如Graphlet Kernel、Weisfeiler-Lehman、GAT/SGAT等)在区分系统本质差异时面临挑战。
为解决这一问题,研究人员提出了一种创新性的热核图演化方法。该方法首次将热扩散的物理模型引入图序列生成过程:通过计算节点热分布概率(Heat Distribution Probability),模拟DropNode操作逐步移除低重要性节点,从而将静态图转化为动态演化序列。为处理序列间的非线性时序偏移,研究进一步设计了图动态时间规整(Graph Dynamic Time Warping, GDTW)算法,并构建基于最优序列匹配的Evolutionary Kernel分类器。实验部分选取MUTAG、PROTEINS等分子数据集和IMDB-Binary、COLLAB等社交网络数据集,采用10折分层交叉验证,结果显示该方法相较基线模型最高提升31.8%的分类准确率。
关键技术方法包括:1) 基于热核的图动态序列生成(Heat Kernel based Graph Evolution);2) 图动态时间规整(GDTW)算法;3) 演化核(Evolutionary Kernel)分类器构建。实验数据来源于公开分子网络和社交网络图数据集。
BACKGROUND AND PROBLEM STATEMENT
研究指出,现有图分类方法(如DeepWalk、node2vec等)主要关注静态图的结构异质性,而忽略由热扩散决定的演化轨迹差异。通过引入谱图理论中的热核概念,将静态图转化为时间轴上的动态序列。
Heat Kernel and Information Diffusion
热核被定义为描述图上游离态密度演化的扩散方程,其物理本质遵循傅里叶热传导定律。在无向连通图中,热核通过拉普拉斯矩阵特征分解模拟信息从高温区域向低温区域的扩散过程,为后续DropNode操作提供概率权重依据。
Temporal Graph Augmentation
通过热驱动增强方法,每个静态图被转化为包含T个时间步的演化序列。关键创新在于利用热分布概率指导节点删除顺序,保留图几何特征决定的演化路径。
Experiments
在监督分类任务中,该方法在8个真实数据集上均显著优于基线模型。例如,在PROTEINS数据集上准确率达76.2%,较传统GNN方法提升12.4%,验证了演化特征对分类性能的增强作用。
Discussion and Conclusion
该研究首次将热核物理模型与图序列匹配相结合,突破静态图分类的局限性。其意义在于:1) 提出动态图序列生成新范式;2) 开发GDTW解决时序对齐难题;3) 为生物网络(如HotNet2研究的疾病基因预测)和社交网络分析提供新工具。论文发表于《Expert Systems with Applications》,为图机器学习领域开辟了动态几何分析的新方向。
生物通微信公众号
知名企业招聘