
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于张量化多尺度二分图融合的可扩展单次多视图聚类方法(SOMVC/TMBGF)
【字体: 大 中 小 】 时间:2025年06月16日 来源:Neural Networks 6.0
编辑推荐:
针对现有锚点多视图聚类方法存在单尺度二分图表征能力有限、视图贡献静态分配等问题,中国研究人员提出SOMVC/TMBGF算法。该方法通过构建多尺度二分图捕捉数据结构特征,采用张量Schatten p-范数约束挖掘视图间高阶相关性,并将分区矩阵学习与聚类统一为动态优化框架。实验证实其在大规模数据上兼具优异聚类性能与线性计算复杂度O(n)。
随着大数据时代的到来,数据多样性和复杂性使得传统单视图聚类方法难以有效提取信息。尤其在处理多源数据时,单一视图往往无法完整揭示数据结构。多视图聚类技术通过整合多视角信息提升性能,但现有锚点(anchor-based)方法存在两大瓶颈:一是仅构建单尺度二分图(bipartite graph),难以精确表征原始数据;二是将分区矩阵(partition matrix)学习与最终聚类割裂处理,无法动态调整视图贡献。
为解决这些问题,安徽大学研究人员在《Neural Networks》发表研究,提出张量化多尺度二分图融合的可扩展单次多视图聚类方法(SOMVC/TMBGF)。该方法创新性地构建多尺度二分图捕捉数据结构,通过张量Schatten p-范数约束挖掘视图间高阶相关性,并将分区矩阵学习与加权谱旋转(weighted spectral rotation)动态整合。实验证明该方法在保持线性计算复杂度O(n)的同时,显著提升聚类精度。
关键技术包括:1) 多尺度二分图生成与自适应融合;2) 基于张量Schatten p-范数的多视图分区矩阵联合优化;3) 动态权重调整的谱旋转聚类框架。研究采用6个真实数据集验证性能,所有实验在Windows 11系统下完成。
研究结果
结论与意义
该研究突破传统锚点方法的表征局限,首次实现多尺度二分图与张量分解的协同优化。通过统一框架动态调整视图贡献,在Caltech101-7数据集上较基线方法运行时间缩短58%。其线性复杂度特性为医疗影像多模态融合、跨平台生物数据整合等大规模应用提供新思路。Fei Wang和Gui-Fu Lu的研究获得国家自然科学基金(61976005)和安徽省高校自然科学研究项目(2022AH050970)支持。
生物通微信公众号
知名企业招聘