
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:一种用于辅助沟通障碍患者的低通道脑电转语音方法
【字体: 大 中 小 】 时间:2025年06月21日 来源:Smart Health CS7.7
编辑推荐:
本综述推荐一种突破性低通道脑电(EEG)-语音转换框架,仅需6通道EEG设备即实现64.24%字符错误率(CER),优于传统64通道系统(68.26% CER)。通过生成-判别器架构与欠完备独立成分分析(UICA)技术,在保留性能(64.99% CER)前提下将通道数降至4通道,显著降低硬件门槛,为资源受限地区的脑机接口(BCI)技术推广提供新范式。
Abstract
脑机接口(BCI)技术为沟通障碍患者带来新希望,但现有脑电(EEG)-语音系统通常依赖64+通道设备,制约其在资源匮乏地区的应用。这项研究提出仅需6通道EEG的语音重建框架,通过生成-判别器架构实现64.24%字符错误率(CER),超越64通道基线系统(68.26% CER)。进一步整合欠完备独立成分分析(UICA)技术后,通道数可压缩至4通道而性能保持稳定(64.99% CER),为BCI技术在基层医疗的普及扫清硬件障碍。
Introduction
全球约2.6亿青少年儿童中,11.2%存在包括语言障碍在内的感官损伤,其中95%生活在低收入国家。卒中、肌萎缩侧索硬化症(ALS)等神经系统疾病导致的失语症患者,传统依赖眼动追踪或手势识别的辅助设备存在明显局限——要求患者保留部分运动功能。EEG-BCI技术通过直接解码脑电信号重建语音,突破了对运动功能的依赖。
然而主流EEG-语音系统需要64+通道设备获取空间信息,高昂成本阻碍其在基层医疗的应用。低通道EEG系统又面临特征提取难题,例如常用空间模式(CSP)方法在通道减少时失效。本研究通过三大创新破局:优化信号处理流程适配低通道EEG;采用UICA技术实现通道压缩;开发基于生成对抗网络(GAN)的模块化架构,在西班牙语指令数据集上验证了其优越性。
Section snippets
Overview
系统架构包含6通道EEG信号采集、UICA降维(6→4通道)、梅尔谱生成器和判别器网络。生成器采用3层LSTM提取时序特征,配合注意力机制聚焦关键脑区活动;判别器通过对抗训练优化频谱重建质量。UICA技术在此过程中有效分离噪声成分,保留与语音相关的独立神经活动成分。
Dataset
实验采用Coretto等人发布的EEG数据集,包含15名健康受试者在想象/说出西班牙语指令(如"arriba"、"izquierda")时的6通道EEG记录。原始数据经0.5-50Hz带通滤波后,采用滑动窗口分割为2秒片段,最终构建含5400样本的训练集。
Conclusion & future works
该框架首次证明低通道EEG可实现连续语音重建,较传统孤立词识别系统更贴近实际应用场景。未来将探索跨语言迁移学习,并优化UICA在病理学EEG信号中的鲁棒性。这项技术突破为BCI在基层医院的落地铺平了道路,尤其适合ALS晚期患者等严重运动功能障碍群体。
CRediT authorship
Kunning Shen完成方法设计与实验验证,Huining Li负责学术指导与论文修订。研究声明无利益冲突,感谢匿名评审的专业建议。
生物通微信公众号
知名企业招聘