
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于空间关系感知图神经网络优化的面部情绪识别技术及其在缓解视频会议疲劳中的应用
【字体: 大 中 小 】 时间:2025年09月09日 来源:Journal of Visual Communication and Image Representation 3.1
编辑推荐:
本文推荐:研究者提出了一种融合自适应多尺度高斯共现滤波(AMGCF)与改进样条核线性调频变换(MSKCT)的优化空间关系感知图神经网络(FER-SRAGNN-POA-RVF),通过谜题优化算法(POA)调参,显著提升了非受控环境下视频情绪识别的准确率。该系统可应用于智能医疗(如自闭症早期诊断)和人机交互场景,为解决视频会议疲劳提供了创新性技术方案。
亮点
本研究创新性地将空间拓扑关系建模与智能优化算法相结合,开发出能"读懂"微表情的AI医生——当视频会议中参与者出现疲惫微表情时,系统会像经验丰富的心理医师般敏锐捕捉肌肉运动的几何特征(如不规则指数和等效直径),为远程心理健康监测装上"智慧之眼"。
文献综述
当前面部情绪识别(FER)方法在真实视频会议场景中面临三大挑战:1) 对光线变化的"弱视"问题 2) 忽视面部关键点空间拓扑关联 3) 缺乏自适应参数优化机制。这导致现有系统如同"色盲的观察者",难以分辨相似度高的表情状态。
方法论
技术路线犹如精密的"情绪解码器":
数据预处理采用AMGCF算法,像高级滤镜般消除视频噪点
MSKCT特征提取模块如同"几何显微镜",量化嘴角弧度等137个动态特征
SRAGNN架构构建面部肌肉运动的"关系图谱",POA优化器则扮演"神经教练"角色
结果
在Ryerson数据库测试中,本系统展现出"读心术"般的性能:
• 准确率91.2%(较传统CNN高18.6%)
• 识别愤怒表情的灵敏度达93.5%
• 单帧处理速度仅47ms,满足实时会议需求
结论
这项"数字表情学家"的研究突破,不仅为视频会议疲劳预警提供了量化工具,更开辟了精神疾病早期筛查的新途径。未来可结合多模态生理信号,打造更完善的远程心理健康监护"数字哨兵"系统。
作者贡献声明
Arti Ranjan负责算法开发与论文撰写,M. Ravinder教授担任研究指导。
利益冲突声明
作者声明不存在可能影响本研究客观性的财务或个人关系。
生物通微信公众号
知名企业招聘