
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于课程学习的符号图神经网络优化框架CSG:从理论突破到应用验证
【字体: 大 中 小 】 时间:2025年08月16日 来源:Neural Networks 6.3
编辑推荐:
(《符号图神经网络(SGNN)的课程学习训练新范式》)本文创新性地将课程学习(Curriculum Learning)引入符号图神经网络(SGNN)训练领域,提出CSG框架。通过理论证明SGNN难以从不平衡三角环(unbalanced cycles)中学习有效表征,设计轻量化难度评估函数,以"由易到难"的样本调度策略显著提升模型性能(AUC最高提升23.7%),为社交网络分析、基因组调控等复杂关系建模提供新思路。
Highlight
符号图(Signed Graph)是刻画复杂正负关联关系的强大模型,符号图神经网络(SGNN)已成为分析此类图数据的有力工具。本研究首次提出为SGNN量身定制训练方案,突破传统随机样本喂入的局限,通过模拟人类"由易到难"的学习模式,显著提升模型性能。
Introduction
在线社交网络1、推荐系统、加密货币平台甚至基因组-表型关联研究中,符号图数据正快速积累。与仅含正边(如"友谊")的无符号图不同,真实世界存在大量负边关系(如"敌对"),如图1所示。例如Slashdot平台允许用户标记"朋友"与"敌人",基因调控中既有上调(upregulation)也有下调(downregulation)。现有SGNN模型(如SGCN)在训练时平等对待所有边,但不同边存在显著学习难度差异——特别是包含矛盾信号的不平衡三角环(图2c),会导致节点表征学习出现根本性矛盾。
Methodology
CSG框架包含三大创新:1)理论证明SGNN难以从不平衡三角环学习有效表征;2)设计轻量化难度评估函数,为属于不平衡三角环的边赋予更高难度分;3)开发课程调度器,按难度分阶段训练模型。这种"先易后难"的策略,使模型先掌握简单边模式再攻克难题,最终实现整体性能提升(见表9)。
Experiments
在六个真实数据集上的实验表明:CSG使主流SGNN模型AUC最高提升23.7%(SGCN模型在Slashdot数据集),标准差降低8.4%(WikiRfa数据集)。即使在40%-70%的训练数据比例下仍保持优势(见表8)。当前局限是仅考虑3-环不平衡结构,因现实符号图普遍稀疏(见表3),更高阶环数量极少(见表2)。
Conclusion
我们开创性地将课程学习引入SGNN训练,提出CSG框架。虽然未能根本解决SGNN的表征局限,但有效缓解了困难样本的负面影响,为社交网络分析、生物调控网络等领域的符号图建模提供了新范式。
生物通微信公众号
知名企业招聘