编辑推荐:
本文提出了一种创新的多视角谱聚类算法(BG-MFS),通过统一优化框架整合二分图构建、多特征相似性融合(Multi-feature Similarity Fusion)和离散聚类过程,有效解决了多视角数据异构性、信息不一致和计算复杂度高的问题。该算法引入基于信息熵的权重机制(entropy-based weighting)和K-means++锚点选择策略,在提升聚类精度(如ACC、NMI指标)的同时显著降低时间复杂度,为多模态医学影像(如MRI/CT/PET)和空间转录组数据分析提供了高效解决方案。
Graph-based Multi-view Clustering Algorithms
基于图的多视角聚类算法首先为每个视角构建相似性图,其中数据点作为图中的节点,边表示数据点之间的相似性。由于不同视角的相似性度量可能不同,每个视角中的边权重可以根据视角重要性进行加权(Yin et al., 2015)。通过构建多个相似性图,该方法能够全面描述数据间的复杂关系,并利用图结构信息进行聚类。
本文中,矩阵用大写字母表示。对于矩阵 X,其Frobenius范数记为 ∥X∥2,Xi,:和 X:,j分别表示矩阵的第i行和第j列。Tr(X)表示矩阵的迹,XT表示转置,Ik表示k维单位矩阵,Ind是一个指示矩阵,其中每行仅有一个元素为1,其余为0。向量1表示所有元素为1的列向量。具体符号定义详见原文。
(1) 求解 Zv:固定 Fv、F^、R、Y和 ωv,通过以下问题更新 Zv:
Zvminv=1∑n∥Xv?AvZv∥F2+α∥Zv∥F2+Tr((Fv)TLvFv),
本文采用两步逼近法优化 Zv。首先获得无约束闭式解,然后通过对 Zv施加约束来逼近最优解。由于每个视角独立,可分别求解各视角的 Zv。
Zmin∥X?AZ∥F2+α∥Z∥F2+Tr(FTLF).
本节将通过相关实验在六个数据集上评估BG-MFS算法的性能,并使用七种常见评估指标与其他聚类算法进行比较。
在多视角聚类分析中,充分利用多视角数据信息已成为关键研究课题。本文提出的BG-MFS多视角聚类算法通过构建二分图、融合多视角特征相似性、采用基于信息熵的加权机制,并直接离散化谱嵌入矩阵获得聚类结果,在优化计算效率的同时提升了聚类性能。具体而言,BG-MFS算法在多个基准数据集上表现出优越的准确性和鲁棒性。