编辑推荐:
为解决蒙面人脸识别准确率低、数据不足等问题,研究人员开展基于深度学习的蒙面人脸识别研究。构建含 GAN、DS-AEAN 和 EAOA 的模型,经多数据集验证,该模型显著提升识别精度,为安防、医疗等领域提供可靠方案。
在公共安全与健康防护需求激增的当下,蒙面场景下的身份识别成为人工智能领域的难题。传统人脸识别技术因面部遮挡导致特征缺失,在口罩、墨镜等遮挡物存在时,识别精度显著下降,尤其在疫情期间,蒙面常态化更凸显这一技术短板。此外,现有模型面临训练数据不足、对复杂遮挡场景泛化能力弱等挑战,亟需一种高效鲁棒的蒙面人脸识别方案。
为攻克上述难题,来自约旦阿尔巴卡应用大学(Faculty of Engineering, Al-Balqa Applied University)等机构的研究人员开展了相关研究。他们提出一种融合生成对抗网络(GAN)与双尺度自适应高效注意力网络(DS-AEAN)的蒙面人脸识别模型,并通过增强型旋角羚优化算法(EAOA)提升模型性能。该研究成果发表于《Scientific Reports》,为智能安防、医疗身份验证等场景提供了关键技术突破。
研究采用的核心技术方法包括:
- GAN 图像增强:利用 GAN 生成高质量蒙面与非蒙面图像,扩充训练数据集,缓解数据不足问题,提升模型对多样输入的适应性。
- DS-AEAN 识别网络:通过双尺度卷积提取多粒度特征,结合自适应注意力机制聚焦关键面部区域(如眼周、额头),增强对遮挡区域的鲁棒性。
- EAOA 优化算法:对网络参数(如 epoch 数、隐藏神经元数量)进行自适应优化,提升模型收敛速度与识别精度。
研究结果
模型架构与数据处理
输入图像经 GAN 处理后,若为蒙面图像则生成非蒙面版本(特征集 1),反之生成蒙面版本(特征集 2);若同时存在两类图像则直接输入 DS-AEAN。DS-AEAN 通过双尺度分支分别处理不同尺度特征,局部特征分支捕捉眼周细节,全局特征分支提取整体结构信息,最终融合特征完成身份识别。研究使用 “Face Mask Detection Dataset” 和 “Real-World-Masked-Face-Dataset”,包含数万张蒙面与非蒙面图像,覆盖多场景光照与遮挡条件。
性能验证与对比
在 K 折交叉验证中,该模型准确率达 95% 以上,显著优于 AMaskNet、DeepMaskNet 等传统模型。例如,在数据集 1 中,其准确率较 AMaskNet 提升 23.07%,在数据集 2 中对复杂遮挡的鲁棒性提升 15% 以上。通过 ROC 曲线分析,模型在真假正例率平衡上表现优异,AUC 值超过 0.95,证明其泛化能力。
参数优化与效率提升
EAOA 通过模拟旋角羚觅食行为优化网络参数,相比传统优化算法(如 AOA、GOA),模型训练耗时减少 30%,内存占用降低 50%(仅 300MB),同时识别精度提升 10%-15%。在不同 epoch 数测试中,300 次迭代时模型准确率达峰值,验证了优化策略的有效性。
实际应用场景拓展
模型在医疗场景可精准识别佩戴口罩的医护人员与患者,在交通枢纽实现蒙面乘客身份核验,在安防领域辅助识别蒙面嫌疑人。实验显示,其对低分辨率、模糊图像的识别准确率较传统 CNN 提升 25%,满足实时监控与快速认证需求。
结论与意义
该研究构建的 GAN-DS-AEAN-EAOA 模型突破了传统蒙面人脸识别的精度瓶颈,通过多技术融合实现了遮挡鲁棒性与泛化能力的显著提升。其核心创新在于:
- 数据增强机制:利用 GAN 生成逼真合成数据,解决蒙面图像标注样本稀缺问题;
- 注意力机制创新:双尺度自适应注意力聚焦关键特征,有效抑制遮挡干扰;
- 优化策略:EAOA 提升参数调优效率,降低计算成本。
研究成果为后疫情时代的公共卫生管理、智能门禁系统、刑事侦查等领域提供了可靠的技术支撑,推动了生物特征识别技术在复杂场景中的实用化进程。未来可进一步融合多模态数据(如热成像、深度传感器),提升模型在极端环境下的性能,拓展其在智慧医疗与智慧城市中的应用边界。