基于张量化多尺度二分图融合的可扩展单次多视图聚类方法(SOMVC/TMBGF)

【字体: 时间:2025年06月16日 来源:Neural Networks 6.0

编辑推荐:

  针对现有锚点多视图聚类方法存在单尺度二分图表征能力有限、视图贡献静态分配等问题,中国研究人员提出SOMVC/TMBGF算法。该方法通过构建多尺度二分图捕捉数据结构特征,采用张量Schatten p-范数约束挖掘视图间高阶相关性,并将分区矩阵学习与聚类统一为动态优化框架。实验证实其在大规模数据上兼具优异聚类性能与线性计算复杂度O(n)。

  

随着大数据时代的到来,数据多样性和复杂性使得传统单视图聚类方法难以有效提取信息。尤其在处理多源数据时,单一视图往往无法完整揭示数据结构。多视图聚类技术通过整合多视角信息提升性能,但现有锚点(anchor-based)方法存在两大瓶颈:一是仅构建单尺度二分图(bipartite graph),难以精确表征原始数据;二是将分区矩阵(partition matrix)学习与最终聚类割裂处理,无法动态调整视图贡献。

为解决这些问题,安徽大学研究人员在《Neural Networks》发表研究,提出张量化多尺度二分图融合的可扩展单次多视图聚类方法(SOMVC/TMBGF)。该方法创新性地构建多尺度二分图捕捉数据结构,通过张量Schatten p-范数约束挖掘视图间高阶相关性,并将分区矩阵学习与加权谱旋转(weighted spectral rotation)动态整合。实验证明该方法在保持线性计算复杂度O(n)的同时,显著提升聚类精度。

关键技术包括:1) 多尺度二分图生成与自适应融合;2) 基于张量Schatten p-范数的多视图分区矩阵联合优化;3) 动态权重调整的谱旋转聚类框架。研究采用6个真实数据集验证性能,所有实验在Windows 11系统下完成。

研究结果

  1. 多尺度二分图构建:为每个视图生成不同尺度的二分图,通过自适应权重融合获得更精确的分区矩阵,相比单尺度方法NMI指标提升12.7%。
  2. 张量高阶建模:将多视图分区矩阵堆叠为三维张量,施加Schatten p-范数约束保留互补信息,使ACC达到0.892±0.015。
  3. 动态聚类框架:通过迭代优化更新视图权重矩阵W(v)
    和旋转矩阵Q,最终聚类标签直接输出,避免传统k-means的随机性。

结论与意义
该研究突破传统锚点方法的表征局限,首次实现多尺度二分图与张量分解的协同优化。通过统一框架动态调整视图贡献,在Caltech101-7数据集上较基线方法运行时间缩短58%。其线性复杂度特性为医疗影像多模态融合、跨平台生物数据整合等大规模应用提供新思路。Fei Wang和Gui-Fu Lu的研究获得国家自然科学基金(61976005)和安徽省高校自然科学研究项目(2022AH050970)支持。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号