高质量受控聚类专家网络：打破图结构噪声与嵌入缺陷的恶性循环

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Pattern Recognition》：High-Quality Controlled Clustering Expert Networks

【字体：大中小】 时间：2025年10月27日 来源：Pattern Recognition 7.6

编辑推荐：

　　本文提出受控聚类专家网络（CCEN），通过输入特征优化（L-GAE编码器）和协同优化机制（强化学习驱动的图结构增强与动态伪标签生成），首次系统性地打破图结构噪声与嵌入缺陷的恶性循环。创新性混合聚类专家模型（MOCE）为自监督学习（SSL）任务提供可扩展的异构融合范式，在六个基准数据集上验证了其卓越的聚类性能。

Highlight

在无监督学习领域，图聚类任务作为揭示数据内在结构的关键方法，始终是研究焦点与挑战。近期许多研究通过同时学习多个聚类任务进一步提升性能，但多任务图聚类仍面临重大挑战——结构噪声与低质量嵌入相互影响的恶性循环，限制了多任务自监督学习（SSL）的性能。为打破此循环，我们提出受控聚类专家网络（CCEN），集成特征与协同优化。CCEN采用判别性编码器（L-GAE）增强节点表征，并通过混合聚类专家模型（MOCE）以半监督方式生成高质量伪标签。进一步地，基于强化学习的图优化策略与动态伪标签形成闭环协同框架，有效抑制噪声并提升嵌入可靠性。

Graph Clustering

图聚类专注于通过学习节点嵌入将节点划分至不同簇，其目标是最大化簇内相似性并最小化簇间相似性。早期方法仅通过将特征投影至低维嵌入来学习节点表征。

Pseudo-Labeling

伪标签生成作为半监督学习的核心方法之一，通过预测未标注数据并筛选高置信度结果提升模型性能。

Notation Definition

给定无向图G，其包含E条边和N个节点，分属K个类别。图的连通性由邻接矩阵A ∈ R^N×N表示，若(v_i, v_j) ∈ E则a_ij=1，否则为0。定义? = A + I为带自环的邻接矩阵，其中I为单位矩阵。归一化对称邻接矩阵表示为D? = D?^-1/2?D?^-1/2，其中D? = Σ_j?_ij为?的度矩阵。

Data Augmentation

对于结构增强，我们采用...

Experiment Setup

1.
数据集与评估指标：我们在Cora、Citeseer等六个基准数据集上验证CCEN可行性，采用ACC、NMI、F1指标评估聚类效果。
2.
基线方法：将CCEN与VGAE、ARVGA等九种先进聚类方法对比。

Conclusion and Future Work

本文从更具判别力的节点表征输入和更合理的伪标签指导出发设计CCEN框架，解决了多任务自监督聚类中权重分配不精确及任务聚合受限的问题。在六个基准数据集上的实验验证了本方法提升聚类性能的有效性，并通过超参数敏感性分析验证了其鲁棒性。未来工作将探索更灵活的任务融合机制与跨领域应用。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号