
-
生物通官微
陪你抓住生命科技
跳动的脉搏
嵌入式标签特异性特征学习在部分多标签学习中的协同优化研究
【字体: 大 中 小 】 时间:2025年06月25日 来源:Pattern Recognition 7.5
编辑推荐:
针对部分多标签学习(PML)中标签歧义与特征噪声的挑战,研究人员提出了一种集成标签特异性特征学习(LSFL)、标签去歧和模型诱导的统一框架LELSF。通过低秩稀疏分解和线性嵌入判别模型,实现了标签与特征的协同优化,在66个数据集上显著超越现有方法,为弱监督学习提供了新范式。
在现实世界的多标签标注任务中,精确标注每个实例的多个标签往往成本高昂且容易出错,导致部分多标签学习(Partial Multi-Label Learning, PML)成为弱监督学习的重要分支。这类场景下,每个实例仅关联一组候选标签,其中既包含真实标签也混杂噪声标签。传统方法要么将候选标签全部视为真实标签(引入噪声干扰),要么孤立处理特征表示与标签去歧,忽略了二者协同优化的潜力。更关键的是,直接从原始高维噪声特征空间提取标签特异性特征(Label-Specific Feature Learning, LSFL)的可靠性存疑。
针对这些瓶颈,中国的研究团队在《Pattern Recognition》发表了创新性成果。他们提出LELSF框架,首次将嵌入式标签特异性特征学习、基于低秩稀疏分解的标签去歧和模型诱导统一于联合优化流程。该框架通过三个核心技术突破现状:1)利用低秩稀疏分解分离真实标签与噪声标签;2)构建线性嵌入判别模型,从低维紧凑空间生成鲁棒的标签特异性特征;3)引入局部几何结构约束,确保特征空间与标签空间的局部一致性。实验覆盖3个真实数据集和63个合成数据集,验证了方法的优越性。
研究结果部分,作者通过以下发现支撑其创新性:
结论部分指出,LELSF首次实现了PML三大核心任务(特征学习、去歧、建模)的端到端联合优化,其嵌入式特征生成策略为高维噪声数据提供了新解决方案。实际应用中,该方法在音乐情感分类(Music_emotion)、图像标注(Mirflickr)等场景展现出强大潜力,未来可扩展至医疗文本多标签诊断等更复杂领域。讨论中强调,低秩假设对标签相关性的建模可能存在局限性,未来可探索非线性嵌入或动态权重机制以进一步提升性能。
生物通微信公众号
知名企业招聘