探索一种用于面部表情识别的非参数不确定自适应训练方法

《Journal of Visual Communication and Image Representation》:Exploring a non-parametric uncertain adaptive training method for facial expression recognition

【字体: 时间:2025年11月08日 来源:Journal of Visual Communication and Image Representation 3.1

编辑推荐:

  面部表情识别中存在标注者主观性和表情模糊性导致的不确定性,引发类间相似和类内差异问题,影响识别性能。本文提出非参数化不确定性自适应(NoPUA)方法,通过构建自适应性特征库、计算样本K相似度排名、设计样本-类别加权分数机制,以及自适应性重标签模块,有效抑制不确定性样本对模型训练的影响。实验表明,NoPUA在RAF-DB、FERPlus、AffectNet等数据集上显著提升各类基线方法性能。

  在人类情感交流中,面部表情扮演着至关重要的角色。它不仅是表达情绪状态和意图的重要方式,还广泛应用于各种人工智能系统中,如社交机器人、虚拟现实、医疗诊断、驾驶员疲劳监测等。随着计算机视觉技术的不断进步,面部表情识别(Facial Expression Recognition, FER)成为研究的热点之一。然而,面部表情识别仍然面临诸多挑战,尤其是在处理不确定性问题时。这些不确定性主要来源于两个方面:一方面,不同标注者对同一张面部图像可能赋予不同的标签,导致标签的主观性和不一致性;另一方面,某些面部表情本身具有模糊性,难以明确归类。因此,如何有效应对这些不确定性,提高模型的鲁棒性和识别精度,成为当前研究的重要方向。

面对上述问题,本文提出了一种名为Non-Parametric Uncertain Adaptive(NoPUA)的方法,该方法通过在训练过程中引入非参数化的不确定性适应机制,对标注不一致的样本进行筛选和修正,从而提升面部表情识别的效果。NoPUA方法的核心思想是通过构建一个自我引导的特征库,并结合相似度排名机制,对样本进行动态评估和标签修正,减少不确定样本对模型训练的干扰。具体而言,NoPUA方法包括四个主要模块:自我引导特征库模块、相似度排名模块、样本到类别权重评分模块以及自我适应标签修正模块。这四个模块相互配合,共同构成了一个完整的不确定性处理流程。

自我引导特征库模块的作用是存储训练过程中逐步增长的面部特征。该模块通过将每个小批量(mini-batch)的面部图像输入到预训练的卷积神经网络(CNN)中,提取出相应的特征,并将这些特征以某种方式组织起来,形成一个动态扩展的特征库。在训练过程中,随着小批量的不断输入,特征库会逐步扩大,为后续的相似度计算提供更丰富的数据支持。相似度排名模块则利用标准化欧几里得距离计算每个样本与特征库中其他样本的相似度,并根据相似度值对样本进行排序。该模块保留每个样本的前K个相似度值,这些相似度值能够反映样本在特征空间中的分布情况,从而为后续的标签修正提供依据。

样本到类别权重评分模块是NoPUA方法的关键部分之一。该模块基于相似度排名的结果,对每个样本可能属于的类别进行评分。评分机制通过比较样本与各类别的相似度,赋予每个类别一个权重值,权重值越高表示该类别与样本越相似。这一机制能够帮助模型识别出哪些样本可能存在标注错误,并为标签修正提供参考。通过这一模块,模型可以更准确地判断样本的类别归属,从而减少由于标注不一致导致的模型偏差。

自我适应标签修正模块则负责对那些被判定为不确定的样本进行标签调整。该模块通过比较样本的原始标签与其在相似度排名中获得的最高评分类别,判断是否存在标签不匹配的情况。如果存在不匹配,则尝试将样本重新标注为评分最高的类别,从而减少不确定样本对模型训练的干扰。这一过程能够有效提升模型的识别能力,使其在面对模糊或不一致的标注时,依然能够保持较高的准确率。

NoPUA方法的一个重要特点是其非参数化特性。这意味着该方法不依赖于特定的模型结构或参数设置,可以灵活地嵌入到各种现有的面部表情识别算法中,如基于标签分布的算法、基于注意力机制的算法等。这种灵活性使得NoPUA方法在实际应用中具有更广泛的适应性,能够适用于不同的模型架构和训练场景。此外,NoPUA方法的实现相对简单,不需要复杂的数学公式或计算资源,因此在计算效率和实用性方面也具有显著优势。

为了验证NoPUA方法的有效性,本文在三个公开的面部表情识别数据集上进行了广泛的实验,包括RAF-DB、FERPlus和AffectNet。这些数据集涵盖了不同场景下的面部表情数据,具有较高的代表性和挑战性。实验结果显示,NoPUA方法在这些数据集上均表现出色,显著提升了模型的识别性能。具体而言,当NoPUA方法被嵌入到不同的面部表情识别算法中时,模型的准确率和鲁棒性都有明显提高。这表明NoPUA方法不仅适用于特定的模型,还能够增强各种模型在面对不确定性时的适应能力。

除了定量实验,本文还进行了定性分析,以探讨NoPUA方法如何缓解不确定性对模型训练的影响。通过可视化分析,可以看到NoPUA方法在处理模糊样本时能够有效区分其与正确类别的相似度,从而避免模型在这些样本上产生错误的判断。此外,通过分析特征空间的变化,可以发现NoPUA方法在训练过程中能够逐步优化模型对不确定样本的处理能力,使其在后续的训练中更加稳定和准确。

本文的研究成果不仅为面部表情识别领域提供了新的方法,还对其他涉及不确定性处理的计算机视觉任务具有重要的参考价值。未来,研究者可以进一步探索NoPUA方法在其他任务中的应用,如目标检测、图像分类等。同时,还可以结合更先进的模型架构,如Transformer、图神经网络等,以提升NoPUA方法的性能和适用范围。此外,随着深度学习技术的不断发展,如何在更大的数据集上验证NoPUA方法的泛化能力,也是值得进一步研究的方向。

综上所述,NoPUA方法通过引入非参数化的不确定性适应机制,有效解决了面部表情识别中由于标注不确定性和表情模糊性带来的问题。该方法不仅能够提升模型的识别性能,还具有良好的灵活性和适应性,可以广泛应用于不同的面部表情识别算法中。本文的实验结果表明,NoPUA方法在多个真实世界数据集上均表现出色,验证了其在实际应用中的有效性。未来,随着相关研究的深入,NoPUA方法有望在更多领域发挥重要作用,为人工智能系统的情感识别能力提供更强的支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号