高质量受控聚类专家网络:打破图结构噪声与嵌入缺陷的恶性循环

《Pattern Recognition》:High-Quality Controlled Clustering Expert Networks

【字体: 时间:2025年10月27日 来源:Pattern Recognition 7.6

编辑推荐:

  本文提出受控聚类专家网络(CCEN),通过输入特征优化(L-GAE编码器)和协同优化机制(强化学习驱动的图结构增强与动态伪标签生成),首次系统性地打破图结构噪声与嵌入缺陷的恶性循环。创新性混合聚类专家模型(MOCE)为自监督学习(SSL)任务提供可扩展的异构融合范式,在六个基准数据集上验证了其卓越的聚类性能。

  
Highlight
在无监督学习领域,图聚类任务作为揭示数据内在结构的关键方法,始终是研究焦点与挑战。近期许多研究通过同时学习多个聚类任务进一步提升性能,但多任务图聚类仍面临重大挑战——结构噪声与低质量嵌入相互影响的恶性循环,限制了多任务自监督学习(SSL)的性能。为打破此循环,我们提出受控聚类专家网络(CCEN),集成特征与协同优化。CCEN采用判别性编码器(L-GAE)增强节点表征,并通过混合聚类专家模型(MOCE)以半监督方式生成高质量伪标签。进一步地,基于强化学习的图优化策略与动态伪标签形成闭环协同框架,有效抑制噪声并提升嵌入可靠性。
Graph Clustering
图聚类专注于通过学习节点嵌入将节点划分至不同簇,其目标是最大化簇内相似性并最小化簇间相似性。早期方法仅通过将特征投影至低维嵌入来学习节点表征。
Pseudo-Labeling
伪标签生成作为半监督学习的核心方法之一,通过预测未标注数据并筛选高置信度结果提升模型性能。
Notation Definition
给定无向图G,其包含E条边和N个节点,分属K个类别。图的连通性由邻接矩阵A ∈ RN×N表示,若(vi, vj) ∈ E则aij=1,否则为0。定义? = A + I为带自环的邻接矩阵,其中I为单位矩阵。归一化对称邻接矩阵表示为D? = D?-1/2?D?-1/2,其中D? = Σj?ij为?的度矩阵。
Data Augmentation
对于结构增强,我们采用...
Experiment Setup
  1. 1.
    数据集与评估指标:我们在Cora、Citeseer等六个基准数据集上验证CCEN可行性,采用ACC、NMI、F1指标评估聚类效果。
  2. 2.
    基线方法:将CCEN与VGAE、ARVGA等九种先进聚类方法对比。
Conclusion and Future Work
本文从更具判别力的节点表征输入和更合理的伪标签指导出发设计CCEN框架,解决了多任务自监督聚类中权重分配不精确及任务聚合受限的问题。在六个基准数据集上的实验验证了本方法提升聚类性能的有效性,并通过超参数敏感性分析验证了其鲁棒性。未来工作将探索更灵活的任务融合机制与跨领域应用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号