基于非凸张量多视图子空间聚类的二分图正则化方法研究

【字体: 时间:2025年06月16日 来源:Pattern Recognition 7.5

编辑推荐:

  本研究针对多视图数据聚类中高计算复杂度与低阶信息利用不足的问题,提出了一种结合非凸加权张量Schatten-p范数(0

  

研究背景

在当今大数据时代,高维数据广泛存在于生物医学、图像识别等领域,但“维度灾难”问题严重阻碍了数据分析效率。传统子空间聚类方法(如SSC、LRR)多依赖单视图信息,难以捕捉多源数据的互补特征。更棘手的是,现有方法常采用两阶段策略(先学习表示矩阵后聚类),不仅计算复杂度高达O(n3
),且忽视不同奇异值的权重差异,导致关键结构信息丢失。

研究设计与方法

深圳大学的研究团队在《Pattern Recognition》发表论文,提出了一种创新性解决方案:通过锚点构建系数矩阵降低计算量,结合二分图捕捉局部结构,并引入加权张量Schatten-p范数(0<>

关键技术

  1. 锚点学习:从样本中选取代表性锚点构建系数矩阵,将复杂度从O(n3
    )降至O(mn)(m?n)。
  2. 二分图正则化:通过系数矩阵构建视图间局部结构关联。
  3. 非凸张量约束:加权Schatten-p范数差异化处理奇异值,保留主成分。
  4. 联合优化框架:同步学习低秩表示与亲和矩阵,避免谱聚类额外开销。

研究结果

1. 模型有效性验证
在ORL、COIL20等数据集上,该方法聚类准确率平均提升12.7%,NMI(标准化互信息)提高9.3%,且运行时间仅为对比方法的1/5。

2. 计算效率分析
锚点策略使万级样本处理时间从小时级缩短至分钟级,内存占用减少68%。

3. 参数敏感性测试
实验表明p=0.5时Schatten-p范数能最优平衡稀疏性与低秩性,λ=0.1对噪声抑制效果最佳。

结论与意义

该研究突破了传统多视图聚类的三大瓶颈:

  1. 计算效率:锚点策略与联合优化大幅降低资源消耗;
  2. 信息利用:张量建模和二分图正则化充分挖掘跨视图结构关联;
  3. 灵活性:非凸约束适应不同数据分布。

这项工作为医学影像分析(如多模态MRI分类)、基因表达数据整合等场景提供了新工具,其代码已开源以促进领域发展。未来可探索自适应锚点选择与动态权重分配以进一步提升性能。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号