
-
生物通官微
陪你抓住生命科技
跳动的脉搏
Soft-GNN:通过自适应数据利用实现稳健的图神经网络
【字体: 大 中 小 】 时间:2025年05月28日 来源:AAAS
编辑推荐:
研究团队推出了 Soft-GNN,这是一个在噪声条件下训练鲁棒 GNN 的框架。Soft-GNN 通过动态数据选择来减轻标签噪声的影响,从而在节点分类任务中实现更佳的性能和更高的效率。
图神经网络 (GNN) 因其高性能而备受关注,并已应用于各种基于图的数据分析任务。然而,其鲁棒性是一个主要问题,尤其是在处理有意或无意地受到噪声污染的图数据时。这给在噪声条件下学习鲁棒的 GNN 带来了挑战。
针对这一问题,Yao WU领导的研究团队 于2025年4月15日在 高等教育出版社和施普林格·自然集团联合出版的《计算机科学前沿》杂志上发表了他们的新研究成果。
该团队提出了一种名为 Soft-GNN 的新型框架,通过调整训练数据来减轻标签噪声的影响。通过更好地利用重要的训练样本,并通过动态数据选择来降低标签噪声的影响,GNN 被训练得更加稳健。与现有研究成果相比,该方法在节点分类任务中取得了更佳的性能,并且具有更高的时间效率。
研究中,他们深入研究了图神经网络 (GNN) 在噪声图数据上的训练,发现训练过程中错误标记节点与正确标记节点之间存在差异,观察到错误标记节点的平均损失大于正确标记节点的平均损失。他们进一步从节点邻域的角度重新审视了错误标记节点与正确标记节点之间的训练差异。具体而言,对于图中的节点,他们从局部和全局结构角度进行分析。从局部和全局角度来看,错误标记节点与正确标记节点之间都存在明显的偏差。这些训练统计特征从预测以及局部和全局邻域的角度揭示了标签噪声的潜在影响,可以进一步用于数据选择。
基于这些观察,他们提出了一个简单而有效的框架来训练鲁棒的GNN,并称之为Soft-GNN。引入的样本网络利用观察到的训练偏差并输出样本权重,以实现自适应数据利用。具体而言,它通过考虑预测、局部和全局偏差来学习样本权重,并根据输出权重修剪标记节点。他们进一步平衡选定的标记节点与相应的权重,并将学习到的权重分配给选定的节点,并进行损失校正以进行模型训练。实验结果表明,Soft-GNN能够在不同的噪声类型和噪声速率下学习鲁棒的GNN模型。此外,当数据无噪声时,其效果仍然更好。此外,Soft-GNN还提高了错误标记节点及其相邻节点的性能。他们重点研究了节点级数据损坏的标签噪声,未来的研究将密切关注其他类型的数据噪声。
生物通微信公众号
知名企业招聘