
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于动态特征图低秩表示与标签松弛机制的多标签特征选择方法研究
【字体: 大 中 小 】 时间:2025年06月17日 来源:Pattern Recognition 7.5
编辑推荐:
针对高维多标签数据中特征空间噪声干扰和标签空间二元化表达不足的问题,研究人员提出RDMFS方法,通过动态特征关系图的低秩表示重构特征空间,结合方向牵引矩阵生成标签松弛矩阵,构建?2,1 -范数约束的优化模型。实验验证其在保留特征物理意义的同时显著提升分类性能,为多标签学习提供可解释性降维新范式。
在服装推荐、医疗诊断等场景中,单个实例常需关联多个标签(如"夏季|男装|棉质"),这种多标签分类任务面临两大挑战:一是高维特征空间中强弱相关性混杂导致噪声干扰,二是二元逻辑标签(0/1)无法体现不同标签的重要性差异。现有多标签特征选择(MFS)方法直接基于原始数据挖掘特征-标签关联,忽略了数据表示机制本身的缺陷。
针对这些问题,华侨大学的研究团队在《Pattern Recognition》发表论文提出RDMFS方法。研究首先利用特征矩阵自表达特性构建动态特征关系图,通过核范数约束获得低秩表示以抑制弱相关性噪声;其次设计方向牵引矩阵扰动原始标签空间,生成能自适应表达标签权重的松弛矩阵;最终建立重构特征空间到标签松弛空间的映射,结合?2,1
-范数稀疏约束实现特征选择。关键技术包括:动态特征图学习、标签松弛矩阵构建、交替方向乘子法(ADMM)优化。
特征空间重构
通过最小化‖X-XZ‖F
2
+α‖Z‖*
(*表示核范数)获得低秩系数矩阵Z,实验显示该方法在Food数据集上使特征间强相关性表达提升37.2%。
标签空间松弛
引入二进制矩阵B指示标签位置,通过Hadamard积运算Y+B°H生成松弛矩阵V,在Scene数据集上使标签区分度提高29.5%。
联合优化模型
构建包含特征重构误差、标签投影误差和?2,1
-范数稀疏约束的目标函数,采用迭代算法求解特征选择矩阵W,在Medical数据集上运行时间较传统方法缩短42%。
实验验证
在12个真实数据集上与6种先进方法对比,RDMFS在Average Precision指标上平均提升8.3%,特别是在Yeast基因数据集上F1-score达到0.732±0.014。
该研究的创新性体现在:概念层面首次将数据表示重构引入MFS领域,提出"特征净化-标签软化"的双重优化框架;方法学上开发出可解释的动态特征图学习机制;应用价值方面为医疗多标签诊断等场景提供特征可追溯的降维方案。未来工作可探索非线性特征关系建模及在线学习机制。
生物通微信公众号
知名企业招聘