
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于共享二分图一致性融合的可扩展多视图聚类方法研究
【字体: 大 中 小 】 时间:2025年07月08日 来源:Knowledge-Based Systems 7.2
编辑推荐:
针对多视图聚类中计算复杂度高、融合策略单一及视图间不一致性忽略等问题,研究人员提出MVC-CFBG框架,通过任意视图分组构建共享二分图,在统一目标函数中建模一致性与不一致性。实验表明该方法在15个基准数据集上显著提升聚类精度与可扩展性,为大规模数据聚类提供新思路。
在数据爆炸的时代,多视图聚类技术因其能整合不同来源的数据特征而备受关注。然而,现有方法面临三大瓶颈:一是传统算法构建N×N全亲和力图时计算复杂度飙升,难以应对大规模数据;二是多数研究采用单阶段融合策略,缺乏对多阶段渐进式融合的探索;三是现有模型过度强调视图间一致性,却忽视了现实数据中普遍存在的视图特异性噪声。这些问题严重制约了多视图聚类在实际场景中的应用。
针对这些挑战,研究人员提出了一种创新性解决方案——基于共享二分图一致性融合的可扩展多视图聚类(MVC-CFBG)。该方法的核心突破在于引入任意视图分组概念,通过早期融合构建视图共享的二分图(N×p矩阵,p?N),大幅降低计算开销。在后期融合阶段,采用统一目标函数同时建模多视图一致性(Consistency)与不一致性(Inconsistency),最终生成鲁棒且可扩展的融合图。实验证明,该方法在15个基准数据集上的聚类精度和运算效率均超越现有技术,尤其擅长处理大规模数据。
关键技术方法包括:1)基于任意视图分组的动态构图技术;2)采用质心点(prime data points)构建稀疏二分图;3)多目标优化框架同步处理一致性与不一致性;4)基于谱聚类(spectral clustering)的最终聚类实现。所有实验均在常规笔记本电脑(Intel i7-2.7GHz/16GB RAM)的Python环境中完成。
研究结果部分显示:
结论部分指出,MVC-CFBG的创新性体现在三方面:首先,任意视图分组机制突破了传统"全视图或单视图"的二元思维;其次,二分图结构设计实现了算法复杂度从O(N2)到O(Np)的质变;最后,统一建模一致性与不一致性的框架显著提升模型鲁棒性。这项工作为处理医疗影像多模态数据、跨平台组学数据等复杂场景提供了新工具,相关成果发表于《Knowledge-Based Systems》。论文作者Shalini等人特别强调,未来将进一步探索视图分组的智能生成策略,以及该方法在动态流数据场景中的应用潜力。
生物通微信公众号
知名企业招聘