基于图重构与自适应加权聚类的光谱集成聚类算法研究

【字体: 时间:2025年06月25日 来源:Pattern Recognition Letters 3.9

编辑推荐:

  针对传统集成聚类(EC)方法中基聚类质量差异固定权重、共联矩阵(CA)构建与聚类生成割裂的问题,研究人员提出了一种自适应调整簇权重的光谱集成聚类算法(SCAC)。该方法创新性地构建加权CA矩阵,通过自加权框架动态分配簇权重,将共识图构建与光谱聚类统一为单一框架,并采用坐标下降法直接生成离散标签矩阵。实验证明该算法在合成和真实数据集上均表现出优越性能,为提升聚类鲁棒性提供了新思路。

  

在数据分析领域,聚类(Clustering)作为无监督学习的重要方法,其核心目标是将相似样本自动归类。然而传统单一聚类算法如K-means、层次聚类或密度聚类,往往受限于数据分布特性,难以普适适用。集成聚类(Ensemble Clustering, EC)通过整合多个基聚类(Base Clusterings)结果来提升鲁棒性,但现有方法存在两大瓶颈:一是固定权重机制无法反映不同基聚类及其内部簇(Cluster)的质量差异;二是共联矩阵(Co-association Matrix, CA)构建与最终聚类过程相互独立,导致信息损失。

针对这些挑战,广州大学的研究团队在《Pattern Recognition Letters》发表创新研究,提出光谱集成聚类从图重构与自适应加权簇的解决方案。该研究通过动态调整簇权重构建加权CA矩阵,将共识图(Consensus Graph)学习与光谱聚类(Spectral Clustering)统一为联合优化框架,并采用坐标下降法(Coordinate Descent Method)直接求解离散标签矩阵,避免了传统光谱聚类中松弛化带来的偏差。

关键技术包括:(1)基于K-means生成多样化基聚类,簇数量范围设定为k到√n;(2)设计自加权框架自动分配簇权重;(3)构建统一目标函数同步优化加权CA矩阵与聚类结果;(4)应用坐标下降法高效求解离散标签。实验采用合成数据集可视化验证,并在真实数据集上以聚类准确率(ACC)等指标评估性能。

【Methodology】
研究团队首先定义加权CA矩阵,其元素值反映样本对在所有基聚类中的加权共现频率。通过引入自加权框架,每个簇的权重与其质量(如簇内紧密度)动态关联。在目标函数设计中,将图拉普拉斯正则化项与加权CA矩阵重构误差结合,使共识图构建与光谱聚类同步进行。优化过程中,采用交替更新策略:固定标签矩阵时解析求权重,固定权重时用坐标下降法更新离散标签。

【Experimental】
在合成数据集上的可视化结果显示,SCAC能准确识别复杂分布模式(如非凸簇)。在UCI真实数据集测试中,其ACC指标平均提升8.7%优于传统EC方法,特别在基聚类质量差异较大时优势更显著。参数敏感性分析表明,算法在k取值范围内保持稳定性能。

【Conclusioin】
该研究突破性地实现了三个创新:(1)首次在簇级别动态分配权重,提升CA矩阵表征能力;(2)建立首个将图学习与光谱聚类统一的联合优化框架;(3)开发高效坐标下降算法直接求解离散解。理论证明该方法的收敛性,实验验证其在不同场景下的优越性。这项工作不仅为集成聚类提供新范式,其自加权思想也可拓展至其他集成学习任务。

作者Xiaojun Yang、Zhenhao Zheng等强调,未来可探索权重机制与深度学习的结合。研究获国家自然科学基金(62306080, 62373112)和广州市科技计划项目(202206010104)支持,相关代码已开源。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号