
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于非言语情感识别的正向特征向量探索及其在语音情感分析中的应用
【字体: 大 中 小 】 时间:2025年07月27日 来源:Biomedical Journal 4.1
编辑推荐:
本研究针对非言语情感识别(NVER)中特征向量筛选难题,创新性地结合改进支持向量机(SVM)算法与加权平均法,从IEMOCAP数据集中筛选出MFCC(86.6%)、F0(90.8%)和熵值(80.1%)三维正向特征向量,为语音情感识别(VER)领域提供精准特征提取方向,推动人机交互与心理健康评估等应用发展。
在人工智能与情感计算交叉领域,语音情感识别(VER)技术正成为人机交互的核心突破口。然而现有研究多集中于言语情感识别(SER),对非言语情感识别(NVER)如叹息、笑声等声音特征的研究仍处于初级阶段。更关键的是,传统方法难以从复杂声学参数中筛选出与情绪强相关的特征向量,导致识别准确率受限。
针对这一挑战,上海科技大学的研究团队在《Biomedical Journal》发表最新成果。研究人员创新性地采用改进支持向量机(SVM)相关性算法,结合加权平均法对IEMOCAP九分类非言语数据集进行深度挖掘。通过采样、分帧、加窗等预处理后,系统提取全维度特征向量,并基于召回率与准确率双指标筛选出三维正向特征向量:Mel频率倒谱系数(MFCC)识别率达86.6%,基频(F0)达90.8%,熵值特征达80.1%。
关键技术包括:1) 改进的SVM相关性特征选择算法;2) 基于IEMOCAP公开数据集的非言语声学分析;3) 加权平均权重计算方法;4) 多维度特征向量交叉验证策略。
【Method】部分显示,研究通过启发式算法优化SVM核函数参数,显著提升特征向量筛选效率。实验采用九分类离散情感模型(愤怒/快乐/悲伤等),验证了非言语声学特征与情绪的强相关性。
【Experiments and results】证实,MFCC特征对恐惧情绪敏感,F0能有效区分愤怒与喜悦,而熵值在检测平静状态时表现突出。相比传统方法,三维组合特征使UAR(非平衡准确率)提升12.7%。
这项研究的突破性在于:首次系统论证非言语声学特征在VER中的独立性价值,为智能医疗的情绪障碍筛查、教育领域的实时情绪反馈等应用提供新思路。特别是F0特征90.8%的识别精度,证实基频参数可作为情绪强度的量化指标。未来研究可基于此三维特征框架,开发轻量化嵌入式情感识别系统。
生物通微信公众号
知名企业招聘