基于共识引导的个体图学习方法:通过增强型张量低秩技术实现鲁棒的多视图聚类

《Neural Networks》:Consensus-guided Individual Graph Learning via Enhanced Tensor Low-rank for Robust Multi-view Clustering

【字体: 时间:2025年11月22日 来源:Neural Networks 6.3

编辑推荐:

  多视图聚类方法通过构建各视图相似图并融合为共识图实现聚类,但存在信息损失、误差累积和忽略高阶关联等问题。本文提出CIGETL方法,创新性地以共识图引导各视图相似图学习,通过构建低维公共子空间生成共识图,并利用其作为字典进行自表示学习。方法引入双拉普拉斯流形约束平衡多样性与一致性,列和约束增强模型适应性,并采用改进的张量低秩分解捕捉高阶关联。实验表明该方法在聚类性能和鲁棒性上优于现有方法。

  在现代数据科学和人工智能领域,随着数据采集技术的不断进步,许多现实世界的问题都可以通过多视角(multi-view)的方式来描述。这种多视角的数据形式允许我们从不同的角度或特征空间中获取关于同一对象的信息,从而提供更加全面和丰富的数据表征。例如,在人脸识别任务中,一个人可以通过面部图像、语音信号、步态序列等多种方式来描述;在图像分类任务中,一张图像可以由颜色直方图、纹理特征、深度信息等多个特征进行表征。这种多视角数据的出现,使得传统的基于单一视角的聚类方法在面对复杂数据结构时显得力不从心,因此,研究者们开始探索如何有效地利用多视角数据进行聚类,从而提升模型的性能和鲁棒性。

多视角聚类(Multi-View Clustering, MVC)是一种旨在整合不同视角中的信息,以更准确和全面地建模数据对象的聚类方法。在实际应用中,由于数据采集过程中可能受到各种因素的影响,如设备故障、环境干扰或人为操作错误,导致某些视角的信息丢失或不完整。这种现象使得多视角数据常常呈现出不均衡的质量和复杂的非线性关系,从而对聚类方法提出了更高的要求。因此,如何在多视角数据中有效捕捉和整合这些信息,成为当前研究的一个重要方向。

传统的多视角聚类方法通常遵循一种“学习视角→融合共识”的流程,即首先为每个视角独立地学习一个相似性图,然后通过某种方式将这些相似性图融合成一个共识图,作为后续聚类的依据。然而,这种方法在实际应用中存在诸多问题。首先,在高维噪声数据中,直接构造相似性图会导致不可逆的信息损失,包括几何结构的扭曲和特征的退化。其次,在共识图的构建过程中,由于需要通过迭代优化的方式进行融合,可能会产生误差累积的问题,使得最终的共识图质量受到影响。最后,现有的方法往往将不同视角之间的关系简化为一种线性或低阶的关联,忽视了视角间可能存在的复杂协同效应,例如多样性、一致性以及高阶相关性之间的相互作用。这些局限性使得传统方法在面对真实世界的数据时,难以提供足够鲁棒和精确的聚类结果。

为了克服上述问题,本文提出了一种名为Consensus-guided Individual Graph Learning via Enhanced Tensor Low-Rank(CIGETL)的新方法。CIGETL的核心思想是通过共识图来指导各个视角的个体图学习,从而在提升一致性的同时,保留各视角的多样性信息。这种方法首先在多视角数据的低维公共子空间中学习一致的表示,然后基于这些表示构建一个共识图。该共识图不仅能够有效捕捉视角间的共享信息,还能强化视角之间的一致性,为多视角聚类任务提供一个统一且鲁棒的图结构表征。接下来,CIGETL会在每个视角上对共识图进行结构重建,利用重建后的图作为自表示学习的字典,进一步优化个体图的学习过程。通过这种方式,CIGETL能够在保持视角间一致性的同时,提高每个视角的局部结构建模能力。

此外,CIGETL引入了双重拉普拉斯流形约束,以协调多个视角之间的多样性与一致性。这种约束机制使得模型能够更好地捕捉视角间的协同效应,从而提升整体的聚类性能。同时,为了增强模型对不同数据分布的适应能力,CIGETL还对个体图施加列和约束,确保每个视角的相似性矩阵的列和等于一个特定的值 $ s $(其中 $ 0 < s \leq 1 $)。这一设计不仅有助于保持视角间的结构一致性,还能有效减少噪声对模型的影响,提高鲁棒性。

最后,CIGETL通过将各个视角的表示矩阵堆叠成一个三维张量,并采用增强的张量低秩最小化方法,来分析视角之间的高阶相关性。这一方法能够更全面地捕捉视角间复杂的依赖关系,从而提升模型对多视角数据的整体建模能力。通过这种方式,CIGETL不仅能够有效处理多视角数据中的噪声和缺失问题,还能在多个视角之间建立更加紧密的联系,实现更准确的聚类结果。

在实验部分,我们对CIGETL方法进行了全面的评估,并在六个公开的多视角数据集上进行了对比实验。实验结果表明,CIGETL在聚类性能和鲁棒性方面均优于现有的多视角聚类方法。特别是在面对高噪声和不完整视角的情况下,CIGETL展现出更强的适应能力和稳定性。这一方法不仅能够有效减少信息损失,还能通过双重拉普拉斯流形约束和增强的张量低秩最小化策略,提高模型在复杂数据环境下的表现。

CIGETL的主要创新点在于其对多视角数据处理流程的重新设计。与传统的“学习视角→融合共识”方法不同,CIGETL采用了一种“先学习共识→再指导视角学习”的策略。这种策略的优势在于,它能够在学习共识图的过程中,充分利用多视角之间的共享信息,从而为后续的视角学习提供更可靠的指导。此外,通过在每个视角上对共识图进行结构重建,CIGETL能够更精确地捕捉每个视角的局部结构,避免因直接构造相似性图而导致的信息损失。这种设计使得CIGETL不仅能够提升聚类的准确性,还能增强模型在噪声环境下的鲁棒性。

在方法实现方面,CIGETL采用了一种基于交替方向乘子法(Alternating Direction Multiplier Method, ADMM)的优化算法,用于求解其提出的非凸优化问题。该算法能够在保证模型收敛性的前提下,高效地处理多视角数据中的复杂关系。通过数学上的推导和算法设计,CIGETL能够确保其优化过程始终收敛到KKT点,从而提供稳定且可靠的聚类结果。此外,为了进一步提高模型的计算效率,CIGETL还引入了一种增强的张量低秩最小化算法,该算法能够更精确地处理张量中的小奇异值,从而提升模型对高阶相关性的捕捉能力。

在实验分析中,我们对CIGETL的性能进行了详细评估。通过在多个公开数据集上的测试,CIGETL展现出了优于现有方法的聚类效果。特别是在处理高噪声和不完整视角的情况下,CIGETL能够有效减少噪声对模型的影响,并通过结构重建和双重拉普拉斯流形约束,提高模型的鲁棒性和准确性。这些实验结果表明,CIGETL不仅能够在理论上解决多视角聚类中的关键问题,还能在实际应用中表现出色。

此外,本文还对CIGETL与其他多视角聚类方法进行了对比分析。我们总结了CIGETL与现有方法之间的主要差异,包括其对共识图的利用方式、对视角间关系的建模策略以及对高阶相关性的捕捉能力。这些差异使得CIGETL在多视角聚类任务中具有独特的优势。首先,CIGETL通过共识图来指导个体图的学习,而不是简单地将多个个体图融合成一个共识图。这种方式能够更有效地利用共享信息,同时避免因融合过程中的误差累积而导致的性能下降。其次,CIGETL引入了双重拉普拉斯流形约束,使得模型能够在保持视角间一致性的同时,捕捉视角的多样性特征。最后,CIGETL采用增强的张量低秩最小化方法,使得模型能够更全面地分析视角之间的高阶相关性,从而提升整体的聚类性能。

综上所述,CIGETL是一种全新的多视角聚类方法,其核心思想是通过共识图来指导个体图的学习,从而在提升一致性的同时,保留各视角的多样性信息。该方法通过双重拉普拉斯流形约束和增强的张量低秩最小化策略,有效解决了传统方法在信息损失、误差传播和视角间关系建模方面的不足。实验结果表明,CIGETL在多个公开数据集上均表现出色,特别是在处理高噪声和不完整视角的情况下,其鲁棒性和准确性均优于现有方法。因此,CIGETL为多视角聚类任务提供了一种新的思路和方法,具有重要的理论和应用价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号