
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于全局与局部核化图学习的多视图无监督特征选择方法(FSGLK)研究
【字体: 大 中 小 】 时间:2025年06月29日 来源:Neurocomputing 5.5
编辑推荐:
为解决多视图数据中非线性特征对特征选择的影响问题,研究人员提出了一种新型多视图无监督特征选择方法FSGLK(Global and Local Kernelized Graph Learning)。该方法通过核化图学习捕获全局结构,结合自适应邻域策略增强局部结构捕捉能力,并利用低秩张量与非负矩阵分解保留视图间高阶相关性。实验表明,FSGLK在聚类精度、一致性和信息共享方面显著优于现有方法,为高维数据处理提供了更优解决方案。
在当今大数据时代,多视图数据(Multi-view data)已成为图像处理、文本挖掘和生物医学等领域的重要研究对象。这类数据通过不同传感器或特征提取方法(如SIFT、LBP等)描述同一对象,蕴含丰富的互补信息。然而,高维特性带来的计算负担和冗余特征严重制约了数据分析效率。传统特征选择方法多依赖线性假设,难以捕捉复杂非线性结构;现有图学习方法又常因参数敏感或单视角建模而忽略局部与全局结构的互补性。针对这些挑战,宁波大学的研究团队在《Neurocomputing》发表论文,提出了一种融合核化图学习与低秩约束的多视图无监督特征选择框架FSGLK。
研究团队采用三大核心技术:1)通过核映射(Kernel mapping)处理非线性数据;2)联合全局自表示学习(Global self-representation)与局部相似性图构建;3)结合低秩张量(Low-rank tensor)和对称非负矩阵分解(SNMF)挖掘视图间高阶相关性。实验使用BBCSport等6个基准数据集验证性能。
全局与局部核化图学习
通过核化自适应邻域策略构建相似性图,同时捕获数据局部流形结构和全局分布特性。相比传统线性方法,核技术显著提升了模型对复杂非线性关系的表达能力。
高阶张量约束
将学习到的核化图转化为高阶张量,施加张量核范数约束以挖掘视图间的高阶交互。该方法突破了二维矩阵仅能建模低阶共识的局限,实现了多层级结构信息融合。
特征选择优化
引入?2,p-norm控制投影矩阵行稀疏性,结合SNMF获取低维表示。这种双重约束机制在保留判别性特征的同时,有效消除了冗余特征干扰。
实验验证
在6个基准数据集上的测试显示,FSGLK在聚类准确率(最高提升12.6%)和NMI指标上均超越CDMvFS、TLR等对比方法,特别是在Caltech101-7等复杂数据集上展现出更强的非线性特征捕捉能力。
该研究的意义在于:首次将核技术同时应用于多视图数据的全局与局部结构学习,突破了传统方法对线性假设的依赖;提出的张量-矩阵混合建模框架,为平衡高阶关联与低阶共识提供了新思路;实验证明该方法在无监督场景下仍能保持稳定的特征选择性能,这对医疗影像分析、生物标记物筛选等缺乏标注数据的领域具有重要应用价值。正如作者Min Xu等指出,FSGLK的成功得益于"核化图学习的双重适应性"与"多层级结构表征的协同优化",这一创新范式将为后续多视图学习研究开辟新方向。
生物通微信公众号
知名企业招聘