个性化差分隐私图神经网络:面向低度节点的隐私保护与数据效用平衡新方法

《IEEE/CAA Journal of Automatica Sinica》:Personalized differential privacy graph neural network

【字体: 时间:2025年11月22日 来源:IEEE/CAA Journal of Automatica Sinica 19.2

编辑推荐:

  本刊推荐:针对图神经网络(GNN)中差分隐私(DP)应用导致低度节点数据效用下降的问题,研究人员提出个性化差分隐私图神经网络(PDPGNN)。该方法创新性地基于节点度分配隐私预算,结合加权聚合机制,在Cora等真实图数据集上验证了其在保持ε-DP隐私保护的同时显著提升模型精度,为隐私敏感型图学习应用提供了新思路。

  
在社交推荐、交通预测等敏感应用场景中,图神经网络(Graph Neural Networks, GNN)正发挥着越来越重要的作用。然而,随着图数据隐私泄露事件频发,如何在GNN训练过程中有效保护节点隐私成为亟待解决的难题。差分隐私(Differential Privacy, DP)作为一种严格的隐私保护框架,通过注入噪声的方式为图数据提供隐私保障,但其“一刀切”的隐私预算分配方式却带来了新的问题——现实图中的节点往往遵循功率律分布,即大多数节点具有较少的连接(低度节点),这些节点在均匀噪声扰动下会遭受更严重的数据效用损失。
针对这一挑战,北京理工大学研究团队在《IEEE/CAA Journal of Automatica Sinica》上发表了题为“Personalized Differential Privacy Graph Neural Network”的研究成果,提出了名为PDPGNN的创新方法。该方法的核心思想很直观:既然高度节点凭借其丰富的邻居信息对噪声扰动具有天然鲁棒性,而低度节点对噪声更加敏感,那么为何不“区别对待”呢?PDPGNN通过为不同度数的节点分配差异化的隐私预算,实现了“个性化隐私保护”,在确保整体满足ε-差分隐私的前提下,显著提升了低度节点的数据效用。
为实现这一目标,研究人员主要采用了三个关键技术方法:首先设计了基于节点度的层次化隐私预算分配机制,将隐私预算区间[εse]按节点度分布划分为多个子区间,低度节点获得较大隐私预算(较少噪声),高度节点获得较小隐私预算(较多噪声);其次采用拉普拉斯机制(Lap(Δf/εv))对每个节点的特征数据进行个性化扰动;最后引入加权邻居聚合机制,根据邻居节点的度数为聚合过程分配差异化权重,进一步抑制噪声影响。
个性化隐私预算分配机制的实施效果通过理论分析得到验证。研究团队利用并行组合定理(Theorem 1)证明了即使为不同节点分配不同隐私预算,整个系统仍能满足ε-差分隐私(其中ε=εe)。这是因为节点特征数据可视为互不相交的子集,个性化扰动机制D(X)={D1(X1),...,Dη(Xη)}的最大隐私预算即为εe,从而确保整体隐私保护强度。
加权邻居聚合机制的设计体现了对图结构特性的深入理解。该机制为每个邻居节点j赋予权重wv,j=1+1/dv-dj/(∑i=1Nervdv,i+dv),其中dv为中心节点v的度,dj为邻居节点j的度。这种设计使得高度邻居(可能携带较多噪声)的贡献被适当抑制,而低度邻居(数据相对纯净)的贡献被增强,从而提升聚合结果的准确性。
实验结果显示,在Cora、Citeseer、Pubmed和Facebook四个真实数据集上,PDPGNN在GCN和GraphSAGE两种主流GNN框架下均显著优于均匀隐私保护方法。以GCN框架为例,在Cora数据集上,DP-GCNunif(均匀分配)准确率为88.44%,而DP-GCNpers(个性化分配)提升至90.44%,加入加权聚合机制后进一步达到91.43%。这表明两种创新机制分别贡献约2%和1%的精度提升,验证了方法的有效性。
GNN框架
方法
数据集
Cora
Citeseer
Pubmed
Facebook
GCN
GCNplaintext
94.04%
88.31%
84.24%
90.80%
DP-GCNunif
88.44%
79.38%
72.30%
83.97%
DP-GCNpers
90.44%
82.87%
77.60%
86.33%
Ours
91.43%
84.16%
79.37%
87.42%
模型超参数研究揭示了有趣现象:当GCN层数K(即聚合跳数)增加时,模型精度先升后降。这是因为适度增加K可以融合更多远距离节点信息,提升预测能力;但过度增加K会导致噪声在多层传播中累积,反而损害模型性能。
该研究的创新价值在于首次将个性化隐私保护理念系统性地引入图神经网络训练,突破了传统差分隐私“均匀保护”的局限。通过紧密耦合图结构特性(节点度分布)与隐私预算分配,PDPGNN在数学严格性(满足ε-DP)与实用效能(提升低度节点数据效用)间取得了良好平衡。这种方法可无缝集成到现有GNN框架中,为社交网络分析、医疗知识图谱等隐私敏感场景提供了可用的隐私保护解决方案。未来工作可探索更精细的隐私需求量化指标,如节点中心性、社区结构等,进一步推动个性化隐私保护在图学习中的发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号