面向噪声标签数据的端到端鲁棒人脸特征学习方法及其在MS-Celeb-1M上的应用

【字体: 时间:2025年06月13日 来源:Journal of Visual Communication and Image Representation 2.6

编辑推荐:

  针对噪声标签数据导致人脸识别性能下降的问题,研究人员提出了一种端到端鲁棒特征学习方法。通过在线数据过滤算法(online data filtering)自动分离正确标签数据,并结合在线负中心采样机制(ONCS),在极端噪声的MS-Celeb-1M数据集上训练出128维特征表示,单模型在LFW测试集达到99.33%准确率,接近清洁数据训练效果,为噪声环境下的特征学习提供了新范式。

  

在人工智能技术突飞猛进的今天,人脸识别系统已展现出超越人类能力的性能表现。这一成就主要归功于卷积神经网络(CNN)的广泛应用以及海量训练数据的支持。然而,当研究人员试图通过互联网或影视作品自动采集数据以构建更大规模的数据集时,一个棘手的问题随之浮现——这些数据中往往混杂着大量错误标签。以著名的MS-Celeb-1M数据集为例,近半数的样本都存在标签噪声问题。这种"脏数据"不仅会拖慢模型训练速度,更会显著降低最终识别精度,成为制约人脸识别技术发展的瓶颈。

针对这一挑战,四川大学的研究团队在《Journal of Visual Communication and Image Representation》发表了一项创新研究。他们摒弃了传统的数据清洗预处理步骤,另辟蹊径地开发出一种端到端的鲁棒特征学习方法。该方法的核心在于两个关键创新:一是能动态区分干净数据的在线过滤算法,二是独创的在线负中心采样(ONCS)机制。令人惊叹的是,仅用单模型就在噪声严重的MS-Celeb-1M数据集上训练出128维特征表示,在LFW测试集上取得了99.33%的惊人准确率,几乎追平了使用清洁数据训练的效果。

研究团队采用了三项关键技术:首先构建了基于CNN的双损失监督框架(结合softmax loss和center loss);其次开发了动态阈值在线数据过滤算法,通过计算样本与类中心的特征空间距离实现噪声分离;最后创新性地提出ONCS机制,利用噪声数据作为负样本来增强特征判别性。这些技术的协同作用,使得模型能在不进行任何数据预清洗的情况下直接处理含50%噪声标签的训练集。

[方法]部分的研究显示,通过动态调整的距离阈值,系统能自动识别并隔离噪声样本。同时ONCS机制强制同类样本远离其他类中心,这一设计巧妙地化弊为利,使噪声数据也能为特征学习做出贡献。实验证实,该方法的收敛速度比传统方案快30%,且特征空间的可分离性显著提升。

[实验]部分的系统评估表明,在极端噪声条件下,该方法在LFW、YTF和MegaFace等基准测试集上均接近或超过当前最优水平。特别是在跨数据集测试中,模型展现出优异的泛化能力,证明其学习到的特征具有本质判别性而非过拟合特定噪声模式。

这项研究的突破性意义在于,它首次证明无需繁琐的数据清洗流程,仅通过算法创新就能直接处理大规模噪声标签数据。这不仅大幅降低了人脸识别系统的开发成本,更为其他存在标签噪声的视觉任务提供了重要参考。研究揭示的特征空间动态净化机制,可能引领新一代鲁棒机器学习方法的发展方向。正如作者在[结论]部分强调的,该方法"使噪声数据变废为宝"的设计理念,为处理现实世界中的不完美数据开辟了新途径。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号