多视图聚类中结构锚点图学习的联合优化框架及其应用

【字体: 时间:2025年06月29日 来源:Pattern Recognition 7.5

编辑推荐:

  针对多视图聚类(MvC)中锚点选择与图构建分离、需额外聚类步骤导致信息损失的问题,研究人员提出结构锚点图学习(SAGL)方法。该方法在潜在空间中联合学习共识锚点并构建具有清晰聚类结构的自适应锚点图,通过矩阵乘法形式优化实现端到端学习。实验表明SAGL在常规和大规模数据集上均优于现有方法,为大规模MvC任务提供了高效解决方案。

  

随着数据规模和来源的多样化增长,大规模多视图数据的聚类成为机器学习领域的重要课题。传统多视图聚类(Multi-view Clustering, MvC)方法面临两大挑战:一是锚点选择与图构建过程分离导致次优解;二是需要额外的聚类步骤(如K-means)生成指示矩阵,引入信息损失和计算复杂度。尤其对于大规模数据,基于图的方法计算成本高达O(N2)甚至O(N3),而现有锚点图方法虽能降低复杂度至O(NM)(M?N),但仍无法解决上述根本问题。

针对这些瓶颈,青岛大学自动化与电子工程学院的Wei Guo等人提出了一种创新性解决方案——结构锚点图学习(Structure Anchor Graph Learning, SAGL),相关成果发表于《Pattern Recognition》。该方法首次实现了潜在空间共识锚点学习与结构锚点图构建的联合优化,通过三个关键突破:1)在潜在空间动态学习跨视图共识锚点,替代传统固定锚点选择;2)基于自适应邻居学习,将样本-锚点对距离转化为相似度构建图;3)利用秩约束直接获得具有明确聚类结构的锚点图,无需后处理步骤。这种"真正单阶段"的端到端框架,显著提升了算法效率与聚类精度。

研究采用的核心技术包括:1)潜在空间投影矩阵优化,通过矩阵乘法与迹运算转换实现高效求解;2)自适应邻居学习机制,自动分配视图权重;3)基于连通分量数的秩约束,确保锚图具有精确的k连通分量。实验选用多个真实世界数据集验证性能,包括常规规模数据集(如UCI数据集)和大型数据集(如ImageNet子集)。

主要研究结果

  1. 共识锚点学习:通过多视图潜在空间投影,将原始特征Xv∈Rdv×N映射到共享子空间,联合优化锚点集A∈Rd×M和投影矩阵Wv,避免预选锚点的信息损失。

  2. 结构锚图构建:创新性地将向量求和形式转化为矩阵乘法tr(HvST),其中Hv记录样本-锚点距离,S为待求相似度矩阵。通过引理2证明迭代过程单调收敛,确保算法稳定性。

  3. 端到端聚类:施加rank(LS)=N-k约束(LS为锚图拉普拉斯矩阵),使相似度矩阵S直接呈现k个明显连通分量,实现"建图即聚类"的目标。

  4. 效率优化:提出的矩阵形式转换使计算复杂度从O(N2)降至O(NM),在ImageNet-1K子集(128万样本)上的实验显示,SAGL处理速度比传统谱聚类快两个数量级。

结论与意义
该研究通过数学重构将多视图聚类中的三个关键步骤(锚点选择、图构建、聚类)融合为统一优化问题,开创性地实现了:1)理论创新——提出首个可同时学习锚点和结构图的MvC框架;2)方法创新——设计的矩阵转换方法为大规模优化问题提供通用解决方案;3)应用价值——在Pascal VOC等数据集上,聚类准确率(ACC)平均提升12.7%,标准化互信息(NMI)提高9.3%。

研究还揭示了潜在空间一致性学习与图结构约束的协同作用机制:通过约束锚图的代数连通性,可自然满足谱聚类假设,这一发现为后续图学习研究提供了新思路。作者在GitHub开源了代码,其提出的技术路线已被拓展应用于医疗影像多模态融合等领域,展现出广泛的适用前景。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号