基于特征选择与粗糙图的图卷积神经网络分类方法研究

【字体: 时间:2025年06月28日 来源:Engineering Applications of Artificial Intelligence 7.5

编辑推荐:

  针对图数据中节点特征冗余、结构不确定性及传统GCNs存在的过平滑问题,研究人员提出了一种结合方差过滤特征选择与粗糙集理论的图分类模型FRGCN。该方法通过构建上下近似图捕捉节点间不确定性,设计自注意力池化层(UPSAP)优化特征提取,在15个图数据集上验证了其优越性,为复杂图数据的精准分类提供了新思路。

  

在人工智能领域,图数据结构因其强大的表达能力成为研究热点,但复杂的拓扑关系和节点特征不确定性给传统学习方法带来巨大挑战。现有图卷积神经网络(GCNs)虽能处理图数据,却面临特征冗余、过平滑(over-smoothing)和结构语义丢失等问题,而粗糙集理论在表征数据不确定性方面的潜力尚未被充分挖掘。

天津大学的研究团队在《Engineering Applications of Artificial Intelligence》发表研究,提出基于特征选择的粗糙图分类模型FRGCN。该方法创新性地融合方差过滤特征选择、粗糙集近似权重计算和自注意力池化(UPSAP)技术,通过三阶段优化:首先计算节点特征方差并划分上下近似特征集;其次构建带权重的上下近似图;最后设计端到端GCN模型实现分类。实验证明其在化学分子、生物网络等15个数据集上优于现有算法。

关键技术包括:1) 方差过滤特征选择筛选差异特征;2) 基于节点相似性学习构建粗糙图;3) UPSAP层通过GraphConv提取特征矩阵;4) 分层池化保留重要节点。

研究结果显示:

  1. 特征选择方案:通过计算节点特征方差阈值,有效去除43.7%冗余特征,提升模型运行效率;
  2. 粗糙图构建:定义的上下近似节点权重(Wv)和边权重(We)能准确量化节点间不确定性;
  3. UPSAP机制:相比传统池化,节点重要性排序准确率提升19.2%,缓解了过平滑现象;
  4. 分类性能:在PROTEINS等数据集上分类准确率达89.4%,较基线模型平均提高6.3%。

该研究的突破性在于:首次将粗糙集理论与GCNs结合处理图数据不确定性,提出的方差过滤策略显著降低计算复杂度,UPSAP机制为图池化提供新思路。成果对生物分子相互作用预测、社交网络分析等领域具有重要应用价值,未来可扩展至动态图学习场景。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号