高质量受控聚类专家网络:打破图结构噪声与嵌入缺陷的恶性循环
《Pattern Recognition》:High-Quality Controlled Clustering Expert Networks
【字体:
大
中
小
】
时间:2025年10月27日
来源:Pattern Recognition 7.6
编辑推荐:
本文提出受控聚类专家网络(CCEN),通过输入特征优化(L-GAE编码器)和协同优化机制(强化学习驱动的图结构增强与动态伪标签生成),首次系统性地打破图结构噪声与嵌入缺陷的恶性循环。创新性混合聚类专家模型(MOCE)为自监督学习(SSL)任务提供可扩展的异构融合范式,在六个基准数据集上验证了其卓越的聚类性能。
在无监督学习领域,图聚类任务作为揭示数据内在结构的关键方法,始终是研究焦点与挑战。近期许多研究通过同时学习多个聚类任务进一步提升性能,但多任务图聚类仍面临重大挑战——结构噪声与低质量嵌入相互影响的恶性循环,限制了多任务自监督学习(SSL)的性能。为打破此循环,我们提出受控聚类专家网络(CCEN),集成特征与协同优化。CCEN采用判别性编码器(L-GAE)增强节点表征,并通过混合聚类专家模型(MOCE)以半监督方式生成高质量伪标签。进一步地,基于强化学习的图优化策略与动态伪标签形成闭环协同框架,有效抑制噪声并提升嵌入可靠性。
图聚类专注于通过学习节点嵌入将节点划分至不同簇,其目标是最大化簇内相似性并最小化簇间相似性。早期方法仅通过将特征投影至低维嵌入来学习节点表征。
伪标签生成作为半监督学习的核心方法之一,通过预测未标注数据并筛选高置信度结果提升模型性能。
给定无向图G,其包含E条边和N个节点,分属K个类别。图的连通性由邻接矩阵A ∈ RN×N表示,若(vi, vj) ∈ E则aij=1,否则为0。定义? = A + I为带自环的邻接矩阵,其中I为单位矩阵。归一化对称邻接矩阵表示为D? = D?-1/2?D?-1/2,其中D? = Σj?ij为?的度矩阵。
- 1.数据集与评估指标:我们在Cora、Citeseer等六个基准数据集上验证CCEN可行性,采用ACC、NMI、F1指标评估聚类效果。
- 2.基线方法:将CCEN与VGAE、ARVGA等九种先进聚类方法对比。
Conclusion and Future Work
本文从更具判别力的节点表征输入和更合理的伪标签指导出发设计CCEN框架,解决了多任务自监督聚类中权重分配不精确及任务聚合受限的问题。在六个基准数据集上的实验验证了本方法提升聚类性能的有效性,并通过超参数敏感性分析验证了其鲁棒性。未来工作将探索更灵活的任务融合机制与跨领域应用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号