基于邻域信息聚合与多视图特征提取的对比图聚类方法研究

【字体: 时间:2025年06月26日 来源:Array 2.7

编辑推荐:

  针对图对比聚类中数据增强策略易导致语义漂移、邻域信息利用不足等问题,研究人员提出NIA-MVFE-CGC框架,通过多层感知机(MLP)生成多视图、互信息约束降维及自适应邻域关系矩阵,显著提升聚类性能。实验表明该方法在5个基准数据集上优于现有算法,为图深度学习提供了新思路。

  

随着图数据在社交网络分析、生物信息学等领域的广泛应用,图聚类技术成为挖掘复杂网络隐藏结构的关键工具。然而,现有基于对比学习的图聚类方法面临两大挑战:一是依赖人工设计的数据增强策略可能导致图结构语义漂移;二是传统方法未能充分利用节点属性特征中的邻域信息,导致相似节点可能被错误推离。这些问题严重制约了模型的性能和泛化能力。

针对上述问题,研究人员开展了基于邻域信息聚合与多视图特征提取的对比图聚类(NIA-MVFE-CGC)研究。该工作创新性地采用多层感知机(MLP)替代数据增强来生成多视图,通过互信息最小化约束降低特征冗余,并设计潜在邻域关系构建模块,将学习到的潜在关系与原始图结构融合。此外,引入自适应权重矩阵动态调整样本间相似度,最终在五个基准数据集上验证了方法的优越性。相关成果发表在《Array》期刊。

关键技术包括:1) 使用拉普拉斯滤波器预处理节点特征;2) 双分支MLP架构生成多视图特征Fvi;3) 基于互信息I(yv1;yv2)的特征维度冗余优化;4) 融合原始邻接矩阵A与特征邻接矩阵AF构建自适应关系矩阵W;5) 跨视图结构一致性学习损失Lre

【多视图特征提取模块】
通过多层感知机直接生成多视图特征,避免数据增强带来的干扰。采用互信息约束计算特征协方差矩阵C=FTF,显著降低特征维度间冗余。实验显示该模块使Cora数据集ACC提升5.19%,特征相似度热图呈现明显块状结构。

【邻域信息聚合模块】
创新性地结合原始邻域与潜在邻域构建完整邻接关系。通过权重矩阵ωij动态调节样本相似度,其中Tij=topk(i)-dij量化节点距离差异。在AMAP数据集上,该模块使NMI达到70.26%,较基线提升6.96%。

【跨视图结构一致性学习】
通过最小化相似度矩阵Sij=Fvi·(Fvj)T与原始邻接矩阵差异,实现多视图结构对齐。消融实验表明,移除该组件会使BAT数据集ARI下降12.7%。

研究结论表明,NIA-MVFE-CGC框架通过特征冗余控制和邻域信息融合,有效解决了语义漂移和邻域信息利用不足的核心问题。在Cora、AMAP等数据集上,其ACC、NMI等指标均显著优于GCA、NACL等对比方法。该工作为图聚类研究提供了新范式,未来可进一步探索在动态图和不完整数据上的应用。值得注意的是,框架对超参数α和k的敏感性分析显示其具有良好鲁棒性,这为实际应用提供了重要参考。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号