用于多视图二分图聚类的广义概率图模型

《IEEE Transactions on Pattern Analysis and Machine Intelligence》:Generalized Probabilistic Graphical Modeling for Multi-View Bipartite Graph Clustering

【字体: 时间:2025年11月19日 来源:IEEE Transactions on Pattern Analysis and Machine Intelligence 18.6

编辑推荐:

  多视图双图聚类首次提出基于概率图模型的框架,通过最大似然估计重构数据关系,优化噪声过滤机制,推导出可解释的GProM模型,实验验证其有效性和统计特性。

  

摘要:

多视图二分图聚类(MVBGC)是无监督学习中一个活跃的研究方向,旨在解决传统图聚类方法的可扩展性限制问题。尽管性能有所提升,但许多变体仍然依赖于传统的建模方法,这些方法通过添加额外的模块来增强模型复杂性,却未能揭示变量之间的内在关系。我们首次尝试引入概率图模型来处理多视图二分图聚类问题,并将其重新表述为一个最大似然估计(MLE)问题。这种建模方式能够揭示共性变量、视图特定变量以及噪声成分之间的概率关联。通过去除冗余和干扰(统称为噪声),我们证明了最小化总噪声值可以近似表示多视图数据观测值的MLE下界。进一步地,我们通过引入适合聚类的约束条件,将MLE模型进行了泛化,从而构建了一个通用概率图建模框架(GProM),该框架具有可解释性、简洁性和灵活性。大量实验验证了该框架的有效性。此外,统计显著性分析还揭示了不同分布假设的有效性,为模型设计提供了宝贵的见解。

引言

随着来自各种来源的数据量急剧增长(例如在自动驾驶场景中),汽车通过摄像头、激光雷达和雷达感知周围环境,因此对海量数据进行标注既耗费成本又需要大量人力,这迫切需要发展无监督学习技术[1]、[2]、[3]、[4]。图聚类[5]、[6]、[7]已成为多视图聚类(MVC)[8]、[9]、[10]领域中一个快速发展的研究方向,在社交网络、生物信息学和推荐系统[11]、[12]、[13]中得到广泛应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号