基于卷积神经网络与灰狼优化的热成像情感识别:突破光照限制的鲁棒性研究

【字体: 时间:2025年06月21日 来源:Signal Processing: Image Communication 3.4

编辑推荐:

  针对可见光摄像头在低光环境下难以准确识别人脸表情的问题,研究人员提出结合预训练CNN模型(如EfficientNet-B7)与灰狼优化算法(GWO),通过热成像技术捕捉生理性温度变化,实现跨光照条件的鲁棒情感识别。在IRDatabase和KTFE数据集上分别达到91.42%和99.48%的准确率,为心理健康评估和安防监控提供了新范式。

  

在人类情感交互中,面部表情承载了55%的情绪信息,但传统基于可见光的人脸表情识别(FER)系统常因光照阴影、刻意伪装而失效。尤其在夜间监控或心理疾病评估场景中,这种局限性更为突出。热成像技术通过捕捉面部温度分布——例如焦虑引发的微血管收缩——为情绪识别提供了不受环境光干扰的生理信号。然而,热图像的低对比度和噪声问题,以及缺乏高效的特征提取框架,长期制约其实际应用。

为解决这一挑战,研究人员Anselme Atchogou与Cengiz Tepe提出了一种融合预训练卷积神经网络(CNN)与灰狼优化(GWO)的创新方法。研究选取了包括EfficientNet-B7、ResNet50等10种CNN模型提取热图像特征,并利用GWO优化支持向量机(SVM)、k近邻(kNN)等分类器参数。实验采用IRDatabase(8类情绪)和KTFE(7类情绪)两大热成像数据集验证性能。

关键技术方法
研究通过数据预处理(降噪、人脸裁剪)、迁移学习(预训练CNN特征提取)、GWO参数优化(平衡探索与开发)三阶段流程构建系统。其中EfficientNet-B7在未优化时已达90.30%准确率,经GWO调优后结合梯度提升分类器,在KTFE数据集上创下99.48%的惊人准确率。

研究结果

  1. 模型比较:EfficientNet-B7在多数场景中表现最优,其深层架构更适合捕捉热图像的细微温度模式。
  2. 优化效果:GWO将kNN分类器准确率从87.21%提升至91.42%(IRDatabase),显著优于粒子群(PSO)、遗传算法(GA)等对比优化器。
  3. 跨数据集验证:在KTFE数据集上,梯度提升分类器对"愤怒"和"恐惧"的识别率超98%,证实模型对生理性情绪标记的敏感性。

结论与意义
该研究首次将GWO引入热成像FER领域,通过生物启发优化与深度学习协同,解决了传统方法在特征选择与计算效率上的矛盾。其核心突破在于:

  1. 生理关联性:利用热图像反映的血管收缩/扩张模式,克服了可见光FER的"表情伪装"缺陷;
  2. 轻量化设计:GWO将特征维度缩减40%的同时提升精度,适合部署在边缘设备;
  3. 跨场景适用性:在烟雾、暗光等极端环境下仍保持稳定性能,为自动驾驶舱内监测、抑郁症客观评估提供了新工具。

论文发表于《Signal Processing: Image Communication》,为多模态情感计算开辟了新方向。未来工作可探索动态热视频序列分析,进一步捕捉情绪表达的时序特征。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号