基于非负矩阵三因子分解(ResNMTF)的多视角双向聚类及其新型评估指标双轮廓评分(bisilhouette)的开发与应用

【字体: 时间:2025年09月22日 来源:Pattern Recognition 7.6

编辑推荐:

  本文提出了一种创新的多视角双向聚类方法ResNMTF(限制性非负矩阵三因子分解),通过非负矩阵分解技术整合多源数据,无需预设聚类数量即可识别重叠和非穷尽性双聚类。作者还开发了双轮廓评分(bisilhouette score)作为双聚类专用内在评估指标,可用于超参数调优和结果可视化,在合成与真实数据集上验证了其优于现有方法的性能。

  

Section snippets

Multi-view biclustering approaches

多种方法已被用于解决多视角双向聚类的挑战,包括基于相似性评分、信息理论、概率模型、图论和深度学习的技术。特别是基于降维的方法因其问题表述形式(通常将数据近似为两个因子的乘积)而广受欢迎。其中一个因子与行聚类相关,另一个与列聚类相关,这种形式天然契合双向聚类任务。

Bisilhouette Score

评估所得双聚类并确定最佳聚类数量是聚类领域继承而来的难题。双聚类额外的结构复杂性加剧了这一问题。现有文献缺乏一种专门针对双聚类的评估方法,该方法需同时考虑聚类的紧凑性和分离度,并允许双聚类的非穷尽性和非排他性。当前双聚类文献主要依赖外部指标(如已知真实标签时的调整兰德指数)或特定假设下的内部指标(如方差评分)。这些方法在无监督环境中存在明显局限性。本文提出的双轮廓评分(bisilhouette score)通过同时考虑行和列维度,扩展了传统的轮廓评分(silhouette score),为双聚类评估提供了更全面的解决方案。

Restrictive Non-negative Matrix Tri-Factorisation

本节介绍基于非负矩阵三因子分解(NMTF)的新型双向聚类方法ResNMTF。该方法旨在整合多个数据视角识别双聚类,同时允许非穷尽性和/或非排他性存在。该方法结合了稳定性分析技术,用于检查所选双聚类的稳定性。

Numerical Experiments

本节通过合成数据集和具有不同特征的真实数据集,展示了ResNMTF的性能以及双轮廓评分(bisilhouette score)作为内在评估指标的有效性。ResNMTF与无限制NMTF(通过设Φ=Ψ=Ξ=0实现)以及iSSVD和GFA等竞争方法进行了比较(详见S2.5节)。

Conclusion and discussion

本文提出了用于评估双聚类解决方案的内在指标——双轮廓评分(bisilhouette score)。该评分在无监督环境中为超参数调优和双聚类方案选择提供了有前景的解决方案。在ResNMTF中,双轮廓评分在选择稳定性分析参数方面的表现似乎不如在选择限制超参数时出色,这可能是因为该评分倾向于保留具有最高内部一致性的聚类,而移除所有其他聚类。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号