
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于聚类图卷积网络的鲁棒多视图聚类方法研究
【字体: 大 中 小 】 时间:2025年07月28日 来源:Knowledge-Based Systems 7.2
编辑推荐:
针对多视图数据聚类中类别判别性不足和视图贡献不平衡问题,研究人员提出新型对比学习框架CGC-RMC。通过设计空间聚类图卷积模块和自适应样本加权策略,显著提升无监督表示学习的聚类性能,在六大多视图数据集上超越11种基准方法。该研究为复杂多源数据的深度表征学习提供了新思路。
在人工智能与大数据分析领域,多视图数据正成为重要的信息载体。这类数据如同多棱镜下的物体,每个视图都能展现独特的特征维度,从视频的视觉-听觉双模态到医疗影像的多序列扫描。然而,现有深度对比学习方法存在两大痛点:一是随着类别数量增加,传统方法聚类性能急剧下降;二是多视图数据中存在"拖后腿"视图——某些视图的参与反而会降低模型精度,就像交响乐中跑调的乐器会破坏整体和谐。
针对这些挑战,研究人员在《Knowledge-Based Systems》发表的研究提出创新性解决方案。该团队设计出Cluster-Graph Convolution networks for Robust Multi-view Clustering(CGC-RMC)框架,其核心突破体现在三方面:首创的批量训练式聚类图卷积能保持样本在所属簇中的局部结构信息;自适应样本加权策略可智能平衡不同视图贡献;通信融合模块有效消除视图私有信息干扰。这些技术创新使模型在Caltech101等复杂数据集上的聚类准确率显著提升。
关键技术方法包括:基于对比学习的多视图编码框架、空间聚类图卷积操作(保留样本邻域关系)、动态样本评分机制(评估视图贡献度)、以及跨视图通信融合模块。实验涵盖CCV等6个数据集,涉及视频、图像等多模态数据,通过聚类准确率(ACC)、标准化互信息(NMI)等指标进行系统评估。
【Method】部分显示,模型通过三个模块协同工作:基础对比框架构建跨视图一致性表示;聚类图卷积模块在特征空间构建动态邻接图,使用图注意力机制聚合簇内样本信息;自适应加权模块通过可学习参数为每个视图样本分配重要性权重。
【Experimental Settings】验证了方法的普适性。在20类的CCV数据集上,CGC-RMC的ACC达到68.7%,较次优方法提升4.2%;在101类的Caltech101上,NMI指标领先基准方法7.5个百分点。消融实验证实,移除图卷积模块会使聚类性能下降12%-15%,证明簇结构保持的关键作用。
【Conclusion】指出该研究开创性地将图卷积引入批量训练范式,解决了无监督学习中类别判别性不足的难题。自适应加权机制为多视图融合提供新思路,其设计原理可拓展至异常检测等领域。这项工作为处理复杂多源数据提供了重要方法论参考,特别是在医疗影像分析、跨模态检索等需要挖掘深层关联的应用场景中展现出独特价值。
生物通微信公众号
知名企业招聘