基于张量化多尺度二分图融合的可扩展单次多视图聚类方法(SOMVC/TMBGF)

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年06月16日 来源：Neural Networks 6.0

编辑推荐：

　　针对现有锚点多视图聚类方法存在单尺度二分图表征能力有限、视图贡献静态分配等问题，中国研究人员提出SOMVC/TMBGF算法。该方法通过构建多尺度二分图捕捉数据结构特征，采用张量Schatten p-范数约束挖掘视图间高阶相关性，并将分区矩阵学习与聚类统一为动态优化框架。实验证实其在大规模数据上兼具优异聚类性能与线性计算复杂度O(n)。

随着大数据时代的到来，数据多样性和复杂性使得传统单视图聚类方法难以有效提取信息。尤其在处理多源数据时，单一视图往往无法完整揭示数据结构。多视图聚类技术通过整合多视角信息提升性能，但现有锚点（anchor-based）方法存在两大瓶颈：一是仅构建单尺度二分图（bipartite graph），难以精确表征原始数据；二是将分区矩阵（partition matrix）学习与最终聚类割裂处理，无法动态调整视图贡献。

为解决这些问题，安徽大学研究人员在《Neural Networks》发表研究，提出张量化多尺度二分图融合的可扩展单次多视图聚类方法（SOMVC/TMBGF）。该方法创新性地构建多尺度二分图捕捉数据结构，通过张量Schatten p-范数约束挖掘视图间高阶相关性，并将分区矩阵学习与加权谱旋转（weighted spectral rotation）动态整合。实验证明该方法在保持线性计算复杂度O(n)的同时，显著提升聚类精度。

关键技术包括：1) 多尺度二分图生成与自适应融合；2) 基于张量Schatten p-范数的多视图分区矩阵联合优化；3) 动态权重调整的谱旋转聚类框架。研究采用6个真实数据集验证性能，所有实验在Windows 11系统下完成。

研究结果

多尺度二分图构建：为每个视图生成不同尺度的二分图，通过自适应权重融合获得更精确的分区矩阵，相比单尺度方法NMI指标提升12.7%。
张量高阶建模：将多视图分区矩阵堆叠为三维张量，施加Schatten p-范数约束保留互补信息，使ACC达到0.892±0.015。
动态聚类框架：通过迭代优化更新视图权重矩阵W^(v)
和旋转矩阵Q，最终聚类标签直接输出，避免传统k-means的随机性。

结论与意义
该研究突破传统锚点方法的表征局限，首次实现多尺度二分图与张量分解的协同优化。通过统一框架动态调整视图贡献，在Caltech101-7数据集上较基线方法运行时间缩短58%。其线性复杂度特性为医疗影像多模态融合、跨平台生物数据整合等大规模应用提供新思路。Fei Wang和Gui-Fu Lu的研究获得国家自然科学基金(61976005)和安徽省高校自然科学研究项目(2022AH050970)支持。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号