《Scientific Data》:An EEG Dataset for Visual Imagery-Based Brain–Computer Interface
编辑推荐:
本研究针对视觉意象脑机接口(VI-BCI)研究中高质量数据集稀缺的瓶颈问题,开发了包含22名参与者、10类视觉意象任务的EEG数据集。研究人员通过精心设计的认知梯度范式(几何图形-动物-日常物体),采用32通道1000Hz采集系统,结合EEGNet深度学习模型验证,结果显示三类任务的分类准确率分别达到75.8%(动物)、75.1%(图形)和62.0%(物体),显著优于传统CSP方法。该数据集为探索神经可塑性、跨被试泛化等关键问题提供了重要资源,推动VI-BCI从实验室向实际应用转化。
随着非侵入式脑机接口(BCI)技术的快速发展,解码高级认知活动已成为拓展人机交互能力的关键突破口。其中,基于视觉意象的脑机接口(VI-BCI)因其无需外部刺激即可自主激活特定脑区的独特优势,为沉浸式应用提供了全新路径。然而,这类复杂认知任务的神经表征研究仍面临重大挑战——现有脑电图(EEG)数据集大多聚焦运动意象,导致VI解码模型的开发缺乏高质量数据支撑。
当前BCI研究领域存在一个明显的数据失衡现象:尽管运动意象(MI)数据集已相对成熟(如BCI Competition IV 2a数据集),但专门针对视觉意象的公开数据集却十分稀缺。这种稀缺性主要源于视觉意象神经信号本身具有弱信号、易受个体差异影响的特点,加上EEG信号固有的低信噪比特性,使得可靠特征提取变得异常困难。正是为了突破这一瓶颈,昆明理工大学的研究团队在《Scientific Data》上发表了题为"An EEG Dataset for Visual Imagery-Based Brain-Computer Interface"的研究成果,推出了一个专门针对视觉意象解码的新型EEG数据集。
该研究的创新之处在于其精心设计的认知复杂度梯度范式。研究人员选取了十个日常生活中高度熟悉的图像,分为三个具有明显认知梯度的类别:代表低认知负荷的几何图形(圆形、正方形、五角星),具有生物意义的动物(狗、鱼、鸟),以及功能属性更复杂的日常物体(杯子、椅子、手表、剪刀)。特别值得一提的是,在物体类别中还系统考虑了空间维度差异:杯子和椅子通常被视为三维物体,而手表和剪刀则强调二维平面轮廓。这种设计不仅涵盖了从抽象到具体的认知梯度,还首次系统考察了物体空间属性差异对神经表征的影响。
在技术方法层面,研究团队主要采用了几个关键技术:首先,通过32通道1000Hz采样率的无线EEG设备(Neuracle)采集数据,电极布局遵循扩展的国际10-20系统;其次,使用Psychtoolbox-3实现实验范式,确保视觉刺激的亮度、对比度和饱和度标准化;第三,采用MNE-Python库进行预处理,包括5-30Hz带通滤波和基于Picard算法的独立成分分析(ICA)去噪;最后,通过共同空间模式(CSP)结合K近邻(KNN)的传统方法和EEGNet深度学习模型进行技术验证。所有数据均来自昆明理工大学22名健康参与者(年龄20-23岁),采用BIDS格式在Figshare平台公开共享。
方法学创新与实验设计
研究人员在方法学上实现了多项突破。参与者筛选环节引入了视觉意象生动性问卷(VVIQ)评估,确保所有参与者得分均超过40分的有效阈值(平均61.68)。实验范式采用严格的时序控制:每个试次持续17秒,包括3秒注视点、4秒图像观察、视觉掩蔽、4秒意象执行和4秒休息期。这种设计有效消除了残留视觉后效的干扰。更值得关注的是,每位参与者完成了两次独立记录会话(间隔至少一周),为研究会话内稳定性和跨会话一致性提供了独特资源。
数据质量验证与解码性能
技术验证结果充分证明了数据集的高质量。EEGNet模型在动物、图形和物体意象任务上的分类准确率分别达到76.58%、75.71%和61.72%,显著优于传统CSP方法(50.17%、50.54%和41.19%)。跨会话一致性分析显示,两次会话间的准确率差异均小于2.5%,表明数据集具有优异的时序稳定性。混淆矩阵分析进一步揭示了认知层面的合理性:错误分类模式呈现系统性而非随机性,如动物任务中狗与鸟的混淆反映了知觉邻近性,图形任务中五边形与六边形的混淆源于对称性相似,物体任务中剪刀与刀的混淆则体现了功能相似性。
数据集比较优势
与现有视觉意象EEG数据集相比,本研究的数据集在多个维度展现明显优势:Wilson等人数据集仅包含3个语义概念且样本量小(12人),Pan等人数据集虽包含29个字符但仅6名参与者。而本数据集不仅样本量更大(22人),任务类型更丰富(10类),还首次提供了跨会话数据,为研究长期学习效应和神经可塑性提供了可能。
应用前景与意义
该数据集的发布对VI-BCI领域具有多重意义。首先,它为开发更鲁棒的EEG特征提取和分类算法提供了基准平台,特别是对深度学习方法的训练和验证具有重要价值。其次,清晰的认知梯度设计使研究者能够探索不同复杂度视觉意象的神经表征规律,为理解人类视觉认知系统提供了新视角。最后,跨会话数据的可获得性使得研究视觉意象训练的长期效应成为可能,对BCI系统的实际应用转化具有推动作用。
研究人员在讨论中指出,数据集表现出的结构化错误分类模式不仅验证了技术的可靠性,更反映了人类视觉认知的内在规律。这种认知可解释性为开发更具人性化的BCI系统指明了方向。未来研究可在此基础上进一步探索个体差异的神经基础、跨模态意象的相互作用,以及实时闭环BCI系统的实现策略。
总之,这个高质量VI-EEG数据集的发布填补了复杂认知任务神经解码研究的数据空白,其精心设计的认知梯度范式、严格的质量控制和多模态验证方法为BCI研究提供了新范本。随着更多研究者利用这一资源,我们有理由期待视觉意象脑机接口技术在神经康复、智能控制和人机交互等领域展现出更大应用潜力。