多尺度卷积 Transformer 网络:助力运动想象脑机接口新突破

【字体: 时间:2025年04月16日 来源:Scientific Reports 3.8

编辑推荐:

  为解决运动想象脑电(MI-EEG)信号解码面临的个体差异大、传统卷积神经网络(CNNs)感受野有限等问题,研究人员开展了多尺度卷积 Transformer(MSCFormer)模型用于 MI-EEG 解码的研究。结果显示该模型在相关数据集上精度高,为脑机接口(BCI)应用提供新方案。

  在当今科技飞速发展的时代,脑机接口(Brain-Computer Interface,BCI)技术成为了科学界的一颗璀璨明星,它就像是一座桥梁,连接着人类大脑与外部设备,让人们能够通过大脑发出的信号直接与外界进行交互。运动想象(Motor Imagery,MI)脑机接口基于人们在脑海中模拟特定运动时大脑产生的电信号来实现对外部设备的控制,在神经康复、假肢控制和人机交互等领域有着巨大的应用潜力。
然而,这项技术在实际应用中却面临着诸多挑战。脑电图(Electroencephalography,EEG)信号十分微弱,信噪比极低,就像在嘈杂的环境中努力倾听微弱的声音一样,很容易受到各种干扰,比如肌肉电信号、环境电磁干扰以及眼部活动产生的伪迹等,这些干扰严重影响了信号质量和后续的解码准确性。而且,不同个体在想象相同运动任务时,EEG 信号存在显著差异,即使是同一个人在不同时间进行相同运动想象,信号也会有所不同,这使得准确解码用户意图变得异常困难。传统的机器学习方法在处理 MI-EEG 信号时,通常依赖手工制作的特征,这使得它们对个体差异非常敏感,适应性较差,并且特征提取和分类过程相互分离,不利于联合优化,导致分类性能受限。

为了攻克这些难题,集美大学诚毅学院、集美大学海洋工程学院等研究机构的研究人员展开了深入研究。他们提出了一种全新的多尺度卷积 Transformer(Multi-Scale Convolutional Transformer,MSCFormer)模型,致力于提升 MI-EEG 信号的解码性能。这项研究成果发表在《Scientific Reports》上,为脑机接口技术的发展带来了新的曙光。

研究人员在研究过程中用到了多个关键技术方法。他们使用了公开的 BCI IV-2a 和 IV-2b 数据集进行实验。在数据处理方面,采用零均值标准化(STD)方法对原始 EEG 信号进行预处理,以减少信号幅度变化的影响;运用分割重建(S&R)方法在时域进行数据增强,增加数据的多样性。在模型构建上,结合多尺度卷积神经网络(MSCNN)和 Transformer 编码器的优势,设计了 MSCFormer 模型。

研究结果如下:

  1. 消融实验:通过一系列消融实验,研究人员发现 Transformer 模块和数据增强对模型性能至关重要。去掉 Transformer 模块,BCI IV-2a 数据集平均准确率下降 3.30%,BCI IV-2b 数据集下降 2.38%;去掉数据增强,两个数据集准确率分别下降 9.57% 和 4.12%;同时去掉两者,准确率下降更明显。此外,使用较小的卷积核会导致分类准确率显著下降。
  2. 超参数影响分析:分析了 Transformer 模块深度、多头注意力(MHA)机制中头的数量以及 CNN 模块池化大小等超参数对模型性能的影响。结果表明,Transformer 模块深度为 5 时,模型在两个数据集上准确率较高;MHA 机制中 8 头配置表现最佳;不同数据集有各自最优的池化大小,如 BCI IV-2a 数据集在池化大小为 28 和 44 时达到峰值,BCI IV-2b 数据集在池化大小为 52 时最佳。
  3. 与现有方法对比:将 MSCFormer 与多种先进方法进行比较,结果显示 MSCFormer 在 BCI IV-2a 和 IV-2b 数据集上均取得了最高的平均分类准确率和 kappa 值。在 BCI IV-2a 数据集上,其平均准确率比基于单尺度卷积神经网络(SSCNN)的模型 Shallow ConvNet、EEGNet、Deep ConvNet 分别高 7.80%、5.56%、5.20%;在 BCI IV-2b 数据集上,比 Deep ConvNet、MMCNN、MBEEGNet 等模型的平均准确率也有显著提高。
  4. 特征分布可视化:利用 t 分布随机邻域嵌入(t-SNE)对模型不同阶段的特征进行可视化,发现随着模型处理,不同类别的特征逐渐分离,表明 Transformer 模块增强了模型的表达能力,但仍存在一些误分类情况。

在研究结论和讨论部分,研究人员指出,MSCFormer 模型中的多分支 CNN 结构能够有效捕捉不同尺度的特征,解决 EEG 信号的个体变异性问题,而 Transformer 编码器则增强了全局特征整合,显著提升了解码性能。然而,该模型也存在一些局限性,比如超参数众多,优化耗时;参数数量大,限制了在硬件资源受限设备上的部署;研究主要针对个体特定分类,未涉及跨个体场景。未来的研究可以朝着自动化超参数优化、模型压缩以及拓展到跨个体分类任务等方向展开。总之,MSCFormer 模型为基于 EEG 的脑机接口应用奠定了坚实的基础,有望推动该领域进一步发展,让脑机接口技术更好地服务于人类健康和生活。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号