用于多视图聚类的对比学习和双重对抗表示学习

《IEEE Transactions on Knowledge and Data Engineering》:Contrastive and Dual Adversarial Representation Learning for Multi-View Clustering

【字体: 时间:2025年12月11日 来源:IEEE Transactions on Knowledge and Data Engineering 10.4

编辑推荐:

  针对多视图聚类中存在的视图间分布差异和缺失数据问题,提出CDARL方法,结合交替对抗与对比学习对齐视图表示,自适应融合块学习共识表示,并采用数据补全策略处理缺失视图,实验表明其在完整和不完整数据集上均优于现有方法。

  

摘要:

多视图聚类(MVC)因其能够有效利用多视图数据的互补信息而受到越来越多的关注。尽管现有的MVC方法在许多实际应用中取得了成功,但它们往往忽略了视图特定潜在分布的差异,并且难以确保多视图数据的完整性。为了解决这些挑战并利用深度网络的强大特征提取能力,我们提出了一种新的对比性和对抗性表示学习方法——CDARL,用于处理具有完整和不完整多视图数据的多视图聚类问题。具体而言,CDARL采用交替的对抗性和对比学习来对齐视图特定的表示,将它们驱动到相同的语义潜在空间中,以最小化视图特定分布的差异。此外,通过一个自适应融合模块学习共识潜在表示,该模块整合了来自多个视图的信息。共识表示进一步通过对抗学习进行优化,模拟标准高斯分布到原始数据分布的转换过程。此外,所提出的方法还包含了一种插补策略,用于处理不完整的多视图数据聚类任务。该策略利用重建样本和跨视图邻居从潜在空间和原始空间中插补缺失的视图,从而保留聚类信息,确保了插补样本的质量和可行性。在六个广泛使用的数据集上的实验结果验证了CDARL方法在处理具有完整和不完整多视图数据的MVC问题时,与现有最先进方法相比具有竞争力。

引言

随着数据收集技术和传感器的发展,现实世界数据的规模和数据模态的数量都在不断增加。相应地,人们越来越关注如何有效处理多样化的多视图数据,如文档、图像和视频[1]、[2]。然而,在大多数实际应用中,原始数据是没有标记的。因此,多视图聚类(MVC)[3]、[4]、[5]、[6]、[7]、[8]、[9]、[10]受到了越来越多的关注,它被视为预处理未标记数据的一种有效方法。MVC的关键是从多视图数据中学习一个共识表示,从而能够进一步探索和利用互补信息来解决聚类问题。尽管现有的MVC方法在许多应用中取得了显著的成功,但它们通常依赖于一个严格的假设,即所有视图的数据都是完整的。因此,这些方法在处理现实世界数据时往往表现不佳,因为现实世界数据中可能由于传输错误或数据收集遗漏等问题而包含缺失的样本。为了解决这个问题,人们提出了不完整多视图聚类(IMVC)方法,以从不完整的多视图数据中探索共识聚类信息[11]、[12]。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号