
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于概念分解与鲁棒标签学习的半监督特征选择方法研究
【字体: 大 中 小 】 时间:2025年08月26日 来源:Pattern Recognition 7.6
编辑推荐:
本文提出SCFLR(Semi-Supervised Feature Selection with Concept Factorization and Robust Label Learning),创新性地将概念分解(CF)与L2,1-范数鲁棒标签学习相结合,通过双图正则化同时保留特征空间和数据空间的局部几何结构,解决了高维数据中低方差特征易被忽略的难题。该方法首次实现CF在半监督特征选择(FS)中的应用,并通过收敛性验证的优化算法显著提升图像数据集分类性能。
亮点
• SCFLR首次将概念分解(CF)框架应用于半监督特征选择(FS),通过特征向量的锥形组合生成概念向量,并利用线性回归损失函数充分挖掘标记数据的判别信息。
• 创新性地引入基于L2,1-范数的鲁棒标签学习机制,有效抵抗异常值干扰,同时采用双图正则化技术同步保留特征空间和数据空间的局部流形结构。
方法
SCFLR通过三阶段优化框架实现:
1)概念分解模块:将原始数据矩阵X∈Rn×d分解为特征权重矩阵与概念向量的乘积,其中每个概念向量被表示为特征向量的非负线性组合;
2)标签增强模块:采用L2,1-范数约束标签预测矩阵F∈Rn×c,通过最小化∑i||Fi||2实现行稀疏性,显著提升对噪声标签的鲁棒性;
3)双图正则化:分别构建特征相似图W(f)和数据相似图W(d),通过拉普拉斯正则项保持原始空间几何关系。
实验验证
在ORL、COIL20等标准图像数据集上,SCFLR的聚类准确率(ACC)和归一化互信息(NMI)平均超越基线方法12.6%和9.8%。参数敏感性分析显示,当标签传播系数α=0.7、图正则化系数β=0.3时达到最优平衡。
结论
SCFLR通过CF与半监督学习的有机融合,成功解决了传统方法对高方差特征的偏好问题。其创新性的L2,1-范数标签学习框架为小样本场景下的特征选择提供了新思路,在医学影像分析等领域具有重要应用潜力。
生物通微信公众号
知名企业招聘