《Journal of Web Engineering》:A Novel Collaboration Representation Method of Combining PCANet with Occlusion Positioning for Non-cooperative Face Recognition
编辑推荐:
本文针对非合作场景下人脸识别存在的遮挡干扰与特征表达能力不足等问题,提出一种结合多尺度PCANet(MSPCANet)与马尔可夫随机场(MRF)遮挡定位的协同表征方法。研究通过优化PCA滤波器尺寸、融合多尺度样本信息,并利用遮挡支持向量抑制遮挡区域特征,显著提升了遮挡人脸识别的鲁棒性与准确性。在AR与LFW数据集上的实验表明,该方法在遮挡定位与特征融合方面均取得显著效果,为复杂环境下的人脸识别提供了新思路。
在人工智能与计算机视觉领域,非合作环境下的人脸识别技术一直是研究的热点与难点。所谓“非合作”,是指被识别对象可能处于自然状态、无需刻意配合采集设备,例如在安防监控、公共安全等实际场景中,人脸图像常受到遮挡(如口罩、墨镜、围巾等)、光照变化、姿态偏移等因素的干扰。尽管近年来基于深度学习的人脸识别方法已取得显著进展,但在面对严重遮挡时,模型的性能仍会大幅下降。究其原因,一方面是因为遮挡区域会引入无关噪声,干扰特征提取;另一方面,遮挡位置的不确定性使得传统方法难以有效区分有用信息与干扰信息。
针对上述问题,一项发表于《Journal of Web Engineering》的研究提出了一种创新的协同表征方法,将PCANet(主成分分析网络)与遮挡定位技术相结合,旨在提升非合作人脸识别系统在遮挡条件下的鲁棒性。该研究不仅从特征提取层面引入多尺度信息增强特征表达能力,还首次将马尔可夫随机场(Markov Random Field, MRF)模型用于遮挡区域的精确定位,通过抑制遮挡对应特征、突出有效区域,显著降低了遮挡对分类结果的干扰。
为验证方法的有效性,研究团队在AR和LFW两个公开数据集上进行了系统实验。AR数据集包含126个对象的多姿态、多光照及遮挡(围巾、墨镜)样本,LFW数据集则聚焦于非约束环境下的人脸图像。实验结果表明,在遮挡样本测试中,结合遮挡定位与多尺度特征的方法(MSPCANet-s)始终优于传统PCANet及其变体,尤其在训练样本较少时优势更为明显。这一成果为复杂实际场景中的人脸识别提供了重要的技术支撑。
在方法层面,本研究主要依托以下几项关键技术:
首先,提出多尺度PCANet(MSPCANet),通过输入16×16、32×32、64×64等不同尺度的图像,提取多层次特征并进行拼接,再通过PCA降维避免信息冗余;其次,利用马尔可夫随机场对测试样本中的遮挡区域进行定位,生成遮挡支持向量(occlusion support),并通过广义“与”操作将遮挡对应特征置零;最后,构建基于协同表征(Collaborative Representation, CRC)的分类模型,在去除遮挡影响的特征图上完成识别任务。此外,研究还提出了基于Fisher准则的PCA滤波器尺寸优化方法,通过最小化类内散度与类间散度的差异,自适应确定最佳滤波器大小。
研究结果
1. PCA滤波器尺寸选择
通过对比不同尺寸的PCA滤波器(如3×3、5×5、7×7等)对特征聚类程度和识别率的影响,研究发现滤波器尺寸为5×5时既能保证较高的识别率,又具备较高的计算效率。尽管3×3滤波器在理论优化目标中得分最优,但实际应用中5×5在性能与效率间取得了更好平衡。
2. 遮挡支持的确定
在AR数据集上,针对围巾、墨镜和方块遮挡三种类型,MRF模型均能有效定位遮挡区域。实验显示,该方法对围巾和方块遮挡的检测准确率较高,而墨镜遮挡因镜片反光等因素存在一定误检,但整体仍能显著提升识别效果。
3. 多数据集上的非合作人脸识别实验
在AR数据集中,分别使用围巾和墨镜遮挡的测试样本进行验证。结果表明,无论是单一尺度还是多尺度特征,加入遮挡支持的方法(PCANet-s、MSPCANet-s)均显著优于未加入遮挡信息的方法。尤其在训练样本较少时(如每类1–2个样本),MSPCANet-s的识别率最高,且方差更小,说明其稳定性更强。
在LFW数据集的实验中,尽管样本存在光照、表情等复杂变化,加入遮挡支持的方法仍能在高维特征中保持优势,且随着训练样本数量增加,识别性能进一步提升。ROC曲线分析显示,MSPCANet-s与PCANet-s的曲线最接近左上角,表明其综合分类性能最优。
结论与讨论
本研究通过将遮挡定位与多尺度特征提取相结合,有效解决了非合作人脸识别中的遮挡干扰问题。其主要贡献在于:一是提出了可量化的PCA滤波器尺寸选择准则,克服了传统方法中滤波器大小依赖经验设定的局限性;二是将MRF模型引入遮挡检测,实现了对遮挡区域的精准定位与特征抑制;三是通过多尺度信息融合与协同表征分类,显著提升了特征表达的鲁棒性。
该方法的成功不仅为遮挡人脸识别提供了新的技术路径,也为其他图像识别任务中局部噪声的抑制问题提供了借鉴。未来工作可进一步探索动态遮挡、多模态信息融合等方向,以应对更复杂的实际应用场景。