
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于双重约束的半监督非负矩阵分解(DSNMF)在多视图聚类中的创新应用与性能提升
【字体: 大 中 小 】 时间:2025年09月04日 来源:Knowledge-Based Systems 7.6
编辑推荐:
本文提出了一种新颖的双重约束半监督非负矩阵分解(DSNMF)方法,用于多视图聚类任务。该方法首次同时整合点式(标签)和成对约束信息,通过多视图双重约束(MDC)算法构建标签正则化和图正则化,有效提升聚类性能。实验证明DSNMF在多个真实数据集上优于现有半监督多视图聚类方法(如NMF、MultiNMF等),为有限监督信息下的聚类分析提供了新思路。
Section snippets
Multi-view NMF
非负矩阵分解(NMF)旨在通过两个分解后的非负矩阵乘积尽可能近似原始非负矩阵。设 X=[x1,x2,…,xn]∈Rm×n表示非负数据矩阵,其中 n为数据点数量,m为每个数据点的特征数。矩阵 U=[u1,u2,…,uk]∈Rm×k和 V=[v1,v2,…,vk]∈Rn×k作为两个低维非负矩阵。需注意,除非特别说明,粗体大写字母用于表示矩阵。
Methodology
尽管近十年已提出多种半监督多视图NMF技术及其变体用于多视图数据聚类应用,它们仍存在一共同缺陷,即未能最优利用可用监督信息以提升聚类效能。针对此局限,本节介绍DSNMF方法,其策略性地同时整合点式和成对约束监督信息。首先,MDC算法被开发以充分利用有限标签数据。
Convergence
Theorem 1
DSNMF的目标函数 O在更新规则Eqs. (16)、(20)和(23)下是单调非增的。
鉴于篇幅限制,Theorem 1的详细证明在此省略;然其可于补充材料中获取。
Supervisory Information Effect
在本小节中,我们深入探究监督信息对DSNMF的影响。相较于先前半监督多视图NMF方法,DSNMF通过利用MDC算法展现出显著优势,该算法同时吸纳点式和成对约束信息,从而更有效地指导低维表示学习过程,提升聚类性能。
Datasets
为证实DSNMF在多视图聚类场景中的效能,我们使用五个著名多视图数据集进行实验:COIL20、DP400、LandUse21、UCIDigits和WikipediaArticles。这些数据集源自真实应用,涵盖多样信息源。具体而言,COIL20、DP400和LandUse21包含描绘各类对象的图像数据,UCIDigits包含手写数字图像,而WikipediaArticles封装丰富文本信息。
Conclusion
本文提出了一种新颖的半监督多视图NMF方法,命名为DSNMF,用于多视图聚类场景。不同于先前半监督多视图NMF方法,DSNMF方法开创了一种基于多视图原理的独特双重约束算法,旨在利用更丰富监督信息以提升聚类性能。具体而言,所提出的MDC算法巧妙利用有限标签数据,以点式和成对约束形式同时整合监督信息。
生物通微信公众号
知名企业招聘