《NeuroImage》:Recognizing EEG responses to active TMS vs. sham stimulations in different TMS-EEG datasets: A machine learning approach
编辑推荐:
本研究致力于解决经颅磁刺激联合脑电图(TMS-EEG)研究中,TMS诱发电位(TEPs)易受听觉、体感等混杂因素影响的难题。研究人员创新性地采用双向长短期记忆(BiLSTM)机器学习方法,在两组独立的TMS-EEG数据中,系统评估了真实TMS与多种伪刺激(包括听觉和体感刺激)诱发响应的可区分性。结果表明,该方法能够在少数试次(约20次)后高精度地鉴别出源自TMS直接皮质激活的神经反应,为评估TEP的“真实性”提供了客观的数据驱动标准。
神经科学领域有一个强大的工具组合:一边是能够无创“敲击”大脑特定区域、引发神经元活动的经颅磁刺激(TMS),另一边是能够毫秒级捕捉大脑电活动变化的脑电图(EEG)。将两者结合起来的TMS-EEG技术,为我们打开了一扇窗,得以直接观察大脑皮质被“扰动”后的动态响应,即TMS诱发电位(TEPs)。这些电位波形的早期成分反映了局部皮质的兴奋与抑制活动,而晚期成分则揭示了皮质与皮质下结构间的复杂互动。理想情况下,TEPs是我们窥探大脑内部神经生理特性的一手信息。
然而,现实并不完美。TMS线圈放电时会发出响亮的“咔哒”声,这个声音会通过空气和骨骼传导,在EEG上产生听觉诱发电位(AEP)。同时,TMS产生的电场还会激活头皮肌肉和皮下的感觉神经末梢,引发体感诱发电位(SEP)。这些混杂信号如同背景噪音,与TMS直接激活神经元产生的“真实信号”交织在一起,使得对TEPs的解读变得异常困难。更棘手的是,学术界对于TEPs究竟在多大程度上反映了直接神经激活,又在多大程度上是这些感觉混杂效应的产物,一直存在争议。一些研究认为,在控制了感觉混杂后,TEPs能清晰地区别于感觉响应;另一些研究则发现,TEPs与伪刺激(如只播放声音或只刺激头皮)诱发的EEG响应并无显著差异。这种不确定性,从根本上动摇了我们利用TMS-EEG技术探究大脑功能的信心。因此,开发一种客观、自动化的方法,来有效甄别“真实”的TMS神经响应与各种伪刺激响应,成为该领域亟待解决的关键问题。
为了应对这一挑战,研究人员另辟蹊径,将目光投向了擅长从复杂数据中发现隐藏模式的机器学习(ML)算法。本研究首次在两个独立收集的TMS-EEG数据集上,系统性地应用了一种名为“双向序列到序列长短期记忆网络”(BiLSTM)的机器学习模型。其核心目标非常明确:利用BiLSTM模型,逐一判断EEG信号中的每个时间点,究竟应该被归类为“真实TMS刺激”还是“伪刺激”的响应。通过这种方法,研究人员希望回答一系列关键问题:机器学习能否以至少中等精度在单次试次水平上识别TEPs?在仅平均少数几次试次后,能否达到高精度?机器学习区分TEPs与听觉、体感等多种伪刺激响应的能力如何?更重要的是,这种区分能力能否在基线(刺激前)水平上仅表现出随机水平(即无差异),而在刺激后响应上表现出高区分度,从而证明模型确实捕捉到了“刺激”本身带来的特异性变化?最后,这种高精度的区分能力能否在个体水平上实现?
本研究主要采用了以下关键技术方法:研究使用了两个独立的TMS-EEG数据集,共包含33名健康受试者的27590次试次。两个数据集均对左侧初级运动皮层(M1)进行了刺激,并包含了多种精心设计的伪刺激条件(如模拟TMS感觉的“真实伪刺激”、仅播放TMS声音的“听觉刺激”、以及不同强度的电刺激等),以模拟和分离潜在的混杂因素。核心的分析工具是双向长短期记忆(BiLSTM)机器学习模型。该模型以所有EEG通道在刺激前(-500至 -200 ms)和刺激后(20至 320 ms)共300毫秒窗口内的数据为输入,进行序列到序列的分类,输出每个时间点属于TMS或伪刺激类别的概率。模型评估采用了留一法(LOO)和五折交叉验证(CV),并以分类准确度(Acc)为核心指标,同时计算了灵敏度、特异性、曲线下面积(AUC)和F1分数等性能参数。
3.1. 条件内(TMS和伪刺激的刺激后 vs. 刺激前)比较
3.1.1. TMS1和TMS2具有单次试次中等准确度和20次试次的高准确度
对于数据集1中的有效TMS条件(TMS1,使用了实时TEP优化和噪声掩蔽),其刺激后与刺激前响应的比较显示,单次试次分类达到中等准确度(71.23%),平均20次试次后准确度高达100%。数据集2中的TMS条件(TMS2,使用固定强度刺激)也表现出从中等(单次试次61.32%)到高(20次试次77.62%)的准确度。TMS1的更高性能归因于其更高的信噪比(SNR),这得益于实时TEP引导的参数优化。对替代数据的分析证实,这种区分能力确实源于TEPs的信号结构,而非偶然或伪影。
3.1.2. 两个数据集共有的伪刺激条件显示出可变的准确度水平,但除AEP2外,其单次和平均试次准确度均低于TMS条件
在数据集1中,真实伪刺激(S1)和未掩蔽的听觉刺激(AEP1)达到了中等到高的准确度,而掩蔽的听觉刺激(AEPm1)则表现出低准确度。在数据集2中,未掩蔽的听觉刺激(AEP2)达到了中高准确度,但真实伪刺激(S2)和掩蔽的听觉刺激(AEPm2)的准确度都接近随机水平。重要的是,除了AEP2,所有共享的伪刺激条件的准确度都低于相应的TMS条件。
3.1.3. 各数据集独有的伪刺激条件显示出不同准确度
数据集1独有的高强度电刺激(HES1)表现出中高准确度。数据集2独有的低强度电刺激(LES2)准确度接近随机水平,而未掩蔽的TMS刺激(TMSnm2,即施加TMS但不掩蔽声音)则表现出与TMS相当甚至更高的中高准确度。
3.1.4. 单受试者分析及其他性能参数证实了组水平准确度的发现
单受试者水平的分析重复了组水平的结果趋势,表明组效应并非由少数个体驱动。灵敏度、特异性等指标也与准确度结果一致。交叉验证的结果与留一法结果相似,支持了模型的稳健性。
3.2. 条件间(TMS刺激前 vs. 伪刺激刺激前 以及 TMS刺激后 vs. 伪刺激刺激后)比较
3.2.1. TMS与共有伪刺激条件的基线/刺激前比较导致低/随机水平的准确度
无论是数据集1还是数据集2,将TMS刺激前的EEG与各种伪刺激刺激前的EEG进行比较时,分类准确度都处于低或随机水平(通常低于60%),即使在平均20次试次后也只有边际提升。这表明在刺激施加之前,不同实验条件的脑电背景活动没有系统性差异。
3.2.2. TMS与共有伪刺激条件的刺激后比较产生了中等(单次试次)到高(20次试次)的准确度
与基线比较形成鲜明对比的是,将TMS刺激后的EEG与各种伪刺激(S1, AEP1, AEPm1, S2, AEP2, AEPm2)刺激后的EEG进行比较时,分类准确度显著提升。在数据集1中,单次试次准确度达到中等(68.96%-72.41%),平均20次试次后达到高准确度(88.77%-100%)。数据集2也观察到类似的从中等到高的准确度提升。
3.2.3. TMS与独有伪刺激条件的比较确认了条件间趋势,但TMS2与TMSnm2的刺激后比较除外
TMS与HES1、LES2等独有伪刺激的比较,也遵循了“基线无差异、刺激后可区分”的模式。一个关键的例外是TMS2与TMSnm2(未掩蔽的TMS)刺激后的比较,其准确度仅为低到中等水平。这说明,当TMS不进行声音掩蔽时,其诱发的响应(包含神经激活和听觉成分)与进行了声音掩蔽的TMS响应(主要包含神经激活成分)的差异变小,难以被机器学习有效区分。
3.2.4. 单受试者及其他性能参数证实了组水平准确度的发现
单受试者分析再次验证了组水平模式。其他性能指标也与准确度结果相符。
本研究通过应用BiLSTM机器学习模型,在两个独立的TMS-EEG数据集中系统地验证了真实TMS响应与多种伪刺激响应的可区分性。研究得出的核心结论是:源自TMS直接皮质激活的TEPs,可以在仅少数试次(约20次)后,以高精度与各种感觉混杂(听觉、体感)引起的响应区分开来,并且这种区分能力在个体水平上也普遍成立。这为TEPs的“真实性”提供了强有力的、数据驱动的客观证据。
讨论部分进一步阐释了这些发现的重要意义。首先,研究证实了优化实验流程(如使用实时TEPrt-TEP引导、有效噪声掩蔽)对于提升TEP信噪比和机器学习分类性能的关键作用。其次,结果明确显示,有效的噪声掩蔽能显著抑制听觉诱发电位(AEP),使其响应变得难以与基线区分;而未掩蔽的听觉刺激则能被轻易识别。这直接支持了在TMS-EEG实验中严格进行听觉控制的重要性。第三,TMS与未掩蔽TMS(TMSnm2)响应之间的较低可区分性,恰恰反证了TMS本身确实产生了独特的、非听觉性的神经响应——因为如果TEP完全由听觉成分构成,那么掩蔽与否的TMS响应应该差异巨大而非相似。最后,该机器学习框架为解决TMS-EEG领域的长期争议提供了新工具。它表明,在妥善控制感觉混杂后,TMS诱发的早期至中期(约300毫秒)响应确实主要反映了对皮质的直接神经扰动,而非感觉通路上的附带产物。
总之,这项发表于《NeuroImage》的研究不仅开发并验证了一种客观评估TMS-EEG数据质量的新方法,更从计算分析的角度强化了TMS-EEG技术探测大脑固有生理特性的可靠性。它为推动TMS-EEG研究的标准化、提高其在基础和临床神经科学研究中的可信度与转化价值,奠定了重要的方法论基础。未来的方向包括在更多脑区、临床人群和不同实验设置中验证该方法的普适性,并探索将其整合到实时TMS-EEG监控系统的可能性。