基于人工神经网络表征预测的脑电音乐识别模型构建及其在脑机接口中的应用

【字体: 时间:2025年05月30日 来源:Scientific Reports 3.8

编辑推荐:

  为解决非侵入性脑电记录信号噪声大、信息不完整的问题,Sony计算机科学实验室团队创新性地提出以人工神经网络(ANN)表征作为监督信号,通过对比学习框架训练EEG识别模型。研究构建了音乐识别任务的双分支2D CNN架构,引入PredANN损失函数和200 ms时延优化,使分类准确率提升46.5%,为脑机接口(BCI)开发和音乐认知机制研究提供了新范式。

  

音乐如何在大脑中编码一直是神经科学领域的核心问题。传统脑电图(EEG)技术虽能记录听觉皮层的神经活动,但受限于信号噪声和深层脑区信号衰减,难以构建高精度的识别模型。近年来研究发现,人工神经网络(ANN)处理音乐时产生的表征与人类大脑活动存在相似性,这为突破技术瓶颈提供了新思路。

Sony计算机科学实验室的Taketo Akama团队在《Scientific Reports》发表的研究中,开创性地将ANN表征作为监督信号,通过预测音乐刺激对应的ANN表征来增强EEG模型的识别能力。研究采用NMED-T数据集(包含20名受试者聆听10首歌曲的128导EEG数据),构建了包含EEG和音乐双分支的2D CNN架构。关键技术包括:1)设计PredANN对比损失函数,通过InfoNCE损失实现跨模态特征对齐;2)引入200 ms时延补偿听觉神经响应延迟;3)采用stop-gradient操作防止音乐分支受EEG噪声污染;4)使用滑动窗口策略处理长时程EEG信号。

研究结果显示,在音乐识别任务中:1)引入PredANN损失的模型比基线准确率提升14.1%(p<0.001),且权重初始化鲁棒性更强;2)200 ms时延设置使准确率提升1.7%,与已知的听觉皮层响应延迟相符;3)2D CNN架构较1D CNN准确率提升14.2%,证实时空特征联合提取的优势;4)采用均值聚合的7秒长时程EEG分析准确率达78.3%,呈现显著的时间累积效应(p=7.06×10-12)。

个体化分析发现:1)电子音乐(如歌曲#4 Lebanese Blonde)因独特音色和节奏更易识别(准确率>85%);2)受试者#3表现最佳(95.5%准确率),而#14仅57.5%,反映个体音乐感知差异;3)优秀受试者对各类歌曲均保持高识别率,提示音乐特征差异的影响大于个体差异。

该研究首次实现了通过ANN表征预测来增强EEG模型性能的创新范式,其意义在于:1)为噪声环境下的神经解码提供了"脑信号-ANN表征-任务目标"的新框架;2)证实200 ms时延参数可优化听觉信息解码,深化了对音乐处理神经机制的理解;3)开发的滑动窗口策略为实时BCI系统奠定基础。未来扩大数据集规模和探索多模态融合,有望进一步推动音乐治疗、神经康复等领域的发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号