基于正交变换学习共识与互补二分图的多视图子空间聚类研究

【字体: 时间:2025年05月16日 来源:Expert Systems with Applications 7.5

编辑推荐:

  针对多视图聚类中共识信息挖掘合理性及锚点不一致问题,研究人员开展基于正交变换的多视图子空间聚类(2CBOT-MVSC)研究,建立视图特定与共识表示矩阵关联,实验表明该算法在 8 个基准数据集上有效且具竞争力。

  
在数据爆炸式增长的今天,多视图数据因其能从多个维度刻画样本(如新闻事件的音频、文本、视频报道,或音频数据通过梅尔频率倒谱系数(MFCC)、线性预测分析(LPA)等提取的不同特征),在医疗、多媒体等领域广泛应用。然而,如何有效利用多视图数据中的共识与互补信息实现精准聚类仍是挑战。传统多视图子空间聚类常通过学习统一的共识表示矩阵挖掘共识信息,但这一方法的合理性遭质疑,如 Zheng 等人指出不同视图具有独特自表达特性,强制统一表示矩阵缺乏依据。此外,基于二分图的锚点方法在多视图场景中面临锚点集不一致问题,若各视图独立生成锚点,其差异会干扰共识图学习,现有方法多依赖 “存在一致锚点” 假设,限制了应用范围。

为突破上述瓶颈,研究人员开展了基于正交变换学习共识与互补二分图的多视图子空间聚类(2CBOT-MVSC)研究。该研究未明确提及具体研究机构,其成果发表在《Expert Systems with Applications》。研究提出仅依赖 “多视图系数矩阵应指向相似聚类划分” 的基础假设,通过正交变换建立视图特定表示矩阵与共识表示矩阵的映射关系,在允许锚点集不一致和视图自表示矩阵差异的前提下,学习能反映多视图共识聚类的表示矩阵,为多视图聚类提供了新视角。

研究主要采用以下关键技术方法:

  • 字典学习锚点:将各视图锚点集视为可更新字典,通过优化找到最适合各视图的锚点,允许不同视图锚点集不一致。
  • 正交变换建模关联:将样本表示系数向量视为 Rm线性空间中的嵌入,构建视图特定表示矩阵与共识表示矩阵的映射关系,使共识矩阵学习更合理。
  • 交替优化算法:设计高效算法求解优化问题,平衡计算复杂度与聚类性能。

研究结果


算法有效性验证


在 8 个基准数据集上与现有多视图聚类方法(如多视图非负矩阵分解(NMF)、子空间聚类(MVSC)、谱聚类(MSC)等)对比,2CBOT-MVSC 在聚类准确率(ACC)、归一化互信息(NMI)等指标上表现更优,验证了其挖掘共识信息的有效性。

锚点不一致性鲁棒性


通过消融实验发现,即使各视图锚点集差异显著,算法仍能通过正交变换捕获共识聚类结构,表明其对锚点不一致问题的鲁棒性,突破了传统锚点方法依赖一致锚点的限制。

优化算法性能


复杂度分析显示,交替优化算法的时间复杂度在可接受范围内,适用于中等规模多视图数据聚类,兼顾效率与精度。

研究结论与意义


本研究提出的 2CBOT-MVSC 算法,打破了传统多视图聚类对统一表示矩阵和一致锚点的强假设,通过正交变换建立视图间隐含关联,为共识信息挖掘提供了更灵活的框架。其核心价值在于:

  • 理论创新:不再强制要求视图表示矩阵或锚点一致,仅通过聚类划分相似性假设建立关联,拓宽了多视图聚类的理论基础。
  • 实践价值:有效解决多视图场景中锚点不一致导致的共识图学习难题,在医疗影像多模态分析(如 CT、MRI 图像的联合聚类)、多媒体数据分类等领域具潜在应用价值,可提升复杂多源数据的分析效率。
    该研究为多视图聚类领域提供了新思路,其方法框架有望启发后续针对异构数据融合的更深入研究。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号