综述:一种用于辅助沟通障碍患者的低通道脑电转语音方法

【字体: 时间:2025年06月21日 来源:Smart Health CS7.7

编辑推荐:

  本综述推荐一种突破性低通道脑电(EEG)-语音转换框架,仅需6通道EEG设备即实现64.24%字符错误率(CER),优于传统64通道系统(68.26% CER)。通过生成-判别器架构与欠完备独立成分分析(UICA)技术,在保留性能(64.99% CER)前提下将通道数降至4通道,显著降低硬件门槛,为资源受限地区的脑机接口(BCI)技术推广提供新范式。

  

Abstract
脑机接口(BCI)技术为沟通障碍患者带来新希望,但现有脑电(EEG)-语音系统通常依赖64+通道设备,制约其在资源匮乏地区的应用。这项研究提出仅需6通道EEG的语音重建框架,通过生成-判别器架构实现64.24%字符错误率(CER),超越64通道基线系统(68.26% CER)。进一步整合欠完备独立成分分析(UICA)技术后,通道数可压缩至4通道而性能保持稳定(64.99% CER),为BCI技术在基层医疗的普及扫清硬件障碍。

Introduction
全球约2.6亿青少年儿童中,11.2%存在包括语言障碍在内的感官损伤,其中95%生活在低收入国家。卒中、肌萎缩侧索硬化症(ALS)等神经系统疾病导致的失语症患者,传统依赖眼动追踪或手势识别的辅助设备存在明显局限——要求患者保留部分运动功能。EEG-BCI技术通过直接解码脑电信号重建语音,突破了对运动功能的依赖。

然而主流EEG-语音系统需要64+通道设备获取空间信息,高昂成本阻碍其在基层医疗的应用。低通道EEG系统又面临特征提取难题,例如常用空间模式(CSP)方法在通道减少时失效。本研究通过三大创新破局:优化信号处理流程适配低通道EEG;采用UICA技术实现通道压缩;开发基于生成对抗网络(GAN)的模块化架构,在西班牙语指令数据集上验证了其优越性。

Section snippets
Overview
系统架构包含6通道EEG信号采集、UICA降维(6→4通道)、梅尔谱生成器和判别器网络。生成器采用3层LSTM提取时序特征,配合注意力机制聚焦关键脑区活动;判别器通过对抗训练优化频谱重建质量。UICA技术在此过程中有效分离噪声成分,保留与语音相关的独立神经活动成分。

Dataset
实验采用Coretto等人发布的EEG数据集,包含15名健康受试者在想象/说出西班牙语指令(如"arriba"、"izquierda")时的6通道EEG记录。原始数据经0.5-50Hz带通滤波后,采用滑动窗口分割为2秒片段,最终构建含5400样本的训练集。

Conclusion & future works
该框架首次证明低通道EEG可实现连续语音重建,较传统孤立词识别系统更贴近实际应用场景。未来将探索跨语言迁移学习,并优化UICA在病理学EEG信号中的鲁棒性。这项技术突破为BCI在基层医院的落地铺平了道路,尤其适合ALS晚期患者等严重运动功能障碍群体。

CRediT authorship
Kunning Shen完成方法设计与实验验证,Huining Li负责学术指导与论文修订。研究声明无利益冲突,感谢匿名评审的专业建议。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号