CIRE:基于韵律情绪调制的汉语语音意图解码EEG数据集

《Scientific Data》:CIRE: A Chinese EEG Dataset for decoding speech intention modulated by prosodic emotion

【字体: 时间:2025年10月22日 来源:Scientific Data 6.9

编辑推荐:

  本研究为解决语音脑机接口(BCI)领域中真实意图解码数据匮乏的难题,研发了首个涵盖多种句式结构和意图类型的中文高密度脑电图数据集CIRE。该数据集包含38名受试者在理解相同文本不同韵律情绪所传达态度意图时的128通道EEG记录,结合Wav2vec2声学嵌入特征,通过深度学习模型实现了68.2%的跨被试意图分类准确率,为认知神经科学和类脑算法研究提供了重要数据支撑。

  
在人与机器的语音交互中,同一个文字表达通过不同的韵律情绪可以传递完全相反的意图。比如当学生看到悲伤消息却用欢快语调说"真是个好消息"时,缺乏上下文的情况下,韵律信息就成为理解真实意图的关键。然而当前缺乏专门用于解码韵律调控下语音意图的脑科学数据集,严重制约了语音脑机接口技术的发展。
为解决这一难题,天津大学智能与计算学院张高燕团队在《Scientific Data》发表了题为"CIRE: A Chinese EEG Dataset for decoding speech intention modulated by prosodic emotion"的研究论文。该研究构建了首个中文语音意图识别脑电图数据集CIRE,首次将感叹句、疑问句等多种句式与反语批评、反语恭维等多类意图相结合,为揭示人类意图理解的神经机制提供了重要平台。
研究团队采用严格实验范式,招募38名母语为汉语的在校大学生,在专业隔音实验室中记录其听取240段语音刺激时的128通道脑电信号。所有语音材料由专业演员在录音棚录制,同一文本分别以友好字面意义和不友好非字面意义两种韵律形式呈现。
关键技术方法包括:采用扩展10-5系统的128通道Quik-Cap-SynAmps 2/RT采集脑电信号;通过EEGLAB工具箱进行1-60 Hz带通滤波和50 Hz陷波滤波预处理;使用独立成分分析(ICA)和ICLabel去除眼动、肌电等伪迹;采用DIPFIT工具箱进行等效电流偶极子源定位;基于Wav2Vec2.0-base模型提取声学嵌入特征;运用事件相关电位(ERP)、时频分析和脑网络连接分析神经表征。

数据质量控制与验证

通过独立成分分析验证数据质量,结果显示每位参与者平均获得足够数量的有效脑成分。事件相关电位分析显示,在背侧前额叶皮层(dPFC)区域,友好语调比隐含反语引发更大的P200成分振幅(250-280 ms时间窗),这一发现与韵律加工的早期神经机制相吻合。

脑网络连接分析

时频分析揭示了字面与非字面意图理解在脑网络连接上的显著差异。在150-300 ms时间窗,两种意图类型在脑网络连接上表现出明显不同;而在600-1200 ms时间窗,反语意图在额顶叶和枕顶叶连接上显示出更强的Theta、Alpha和低Beta频段活动。

意图解码性能

研究团队基于图神经网络构建深度学习模型,对积极陈述句的意图进行二分类解码。跨被试验证结果显示,该模型达到68.17%的分类准确率(精确率70.11%,F1分数66.54%,AUC=0.718),证明了数据集在机器学习任务中的适用性。
CIRE数据集的建立填补了韵律情感层面神经数据集的空白,为研究自然交流场景中意图理解的神经机制提供了重要资源。高密度高时间分辨率的脑电数据不仅有助于揭示言语意图理解的时空动态机制,还可推动脑机接口技术发展和类脑算法研究。该数据集已公开于ScienceDB平台,配套代码存放于GitHub仓库,为多学科交叉研究提供了坚实基础。
研究结果表明,人类大脑在理解韵律调控的语音意图时表现出明确的神经相关性差异,早期听觉处理阶段(150-300 ms)和晚期整合阶段(600-1200 ms)的脑网络活动具有显著特异性。这些发现为开发更精准的语音脑机接口系统提供了神经科学依据,同时也为理解人类意图理解的优势机制、改进人机交互体验带来了重要启示。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号