基于对上传文档的分析，现依次回答以下5个问题：中文标题利用序列对序列BiLSTM机器学习模型在多个TMS-EEG数据集中有效甄别真实与伪刺激响应

《NeuroImage》：Recognizing EEG responses to active TMS vs. sham stimulations in different TMS-EEG datasets: A machine learning approach

【字体：大中小】 时间：2026年02月17日 来源：NeuroImage 4.5

编辑推荐：

　　本研究致力于解决经颅磁刺激联合脑电图（TMS-EEG）研究中，TMS诱发电位（TEPs）易受听觉、体感等混杂因素影响的难题。研究人员创新性地采用双向长短期记忆（BiLSTM）机器学习方法，在两组独立的TMS-EEG数据中，系统评估了真实TMS与多种伪刺激（包括听觉和体感刺激）诱发响应的可区分性。结果表明，该方法能够在少数试次（约20次）后高精度地鉴别出源自TMS直接皮质激活的神经反应，为评估TEP的“真实性”提供了客观的数据驱动标准。

神经科学领域有一个强大的工具组合：一边是能够无创“敲击”大脑特定区域、引发神经元活动的经颅磁刺激（TMS），另一边是能够毫秒级捕捉大脑电活动变化的脑电图（EEG）。将两者结合起来的TMS-EEG技术，为我们打开了一扇窗，得以直接观察大脑皮质被“扰动”后的动态响应，即TMS诱发电位（TEPs）。这些电位波形的早期成分反映了局部皮质的兴奋与抑制活动，而晚期成分则揭示了皮质与皮质下结构间的复杂互动。理想情况下，TEPs是我们窥探大脑内部神经生理特性的一手信息。

然而，现实并不完美。TMS线圈放电时会发出响亮的“咔哒”声，这个声音会通过空气和骨骼传导，在EEG上产生听觉诱发电位（AEP）。同时，TMS产生的电场还会激活头皮肌肉和皮下的感觉神经末梢，引发体感诱发电位（SEP）。这些混杂信号如同背景噪音，与TMS直接激活神经元产生的“真实信号”交织在一起，使得对TEPs的解读变得异常困难。更棘手的是，学术界对于TEPs究竟在多大程度上反映了直接神经激活，又在多大程度上是这些感觉混杂效应的产物，一直存在争议。一些研究认为，在控制了感觉混杂后，TEPs能清晰地区别于感觉响应；另一些研究则发现，TEPs与伪刺激（如只播放声音或只刺激头皮）诱发的EEG响应并无显著差异。这种不确定性，从根本上动摇了我们利用TMS-EEG技术探究大脑功能的信心。因此，开发一种客观、自动化的方法，来有效甄别“真实”的TMS神经响应与各种伪刺激响应，成为该领域亟待解决的关键问题。

为了应对这一挑战，研究人员另辟蹊径，将目光投向了擅长从复杂数据中发现隐藏模式的机器学习（ML）算法。本研究首次在两个独立收集的TMS-EEG数据集上，系统性地应用了一种名为“双向序列到序列长短期记忆网络”（BiLSTM）的机器学习模型。其核心目标非常明确：利用BiLSTM模型，逐一判断EEG信号中的每个时间点，究竟应该被归类为“真实TMS刺激”还是“伪刺激”的响应。通过这种方法，研究人员希望回答一系列关键问题：机器学习能否以至少中等精度在单次试次水平上识别TEPs？在仅平均少数几次试次后，能否达到高精度？机器学习区分TEPs与听觉、体感等多种伪刺激响应的能力如何？更重要的是，这种区分能力能否在基线（刺激前）水平上仅表现出随机水平（即无差异），而在刺激后响应上表现出高区分度，从而证明模型确实捕捉到了“刺激”本身带来的特异性变化？最后，这种高精度的区分能力能否在个体水平上实现？

本研究主要采用了以下关键技术方法：研究使用了两个独立的TMS-EEG数据集，共包含33名健康受试者的27590次试次。两个数据集均对左侧初级运动皮层（M1）进行了刺激，并包含了多种精心设计的伪刺激条件（如模拟TMS感觉的“真实伪刺激”、仅播放TMS声音的“听觉刺激”、以及不同强度的电刺激等），以模拟和分离潜在的混杂因素。核心的分析工具是双向长短期记忆（BiLSTM）机器学习模型。该模型以所有EEG通道在刺激前（-500至 -200 ms）和刺激后（20至 320 ms）共300毫秒窗口内的数据为输入，进行序列到序列的分类，输出每个时间点属于TMS或伪刺激类别的概率。模型评估采用了留一法（LOO）和五折交叉验证（CV），并以分类准确度（Acc）为核心指标，同时计算了灵敏度、特异性、曲线下面积（AUC）和F1分数等性能参数。

3.1. 条件内（TMS和伪刺激的刺激后 vs. 刺激前）比较

3.1.1. TMS1和TMS2具有单次试次中等准确度和20次试次的高准确度

对于数据集1中的有效TMS条件（TMS1，使用了实时TEP优化和噪声掩蔽），其刺激后与刺激前响应的比较显示，单次试次分类达到中等准确度（71.23%），平均20次试次后准确度高达100%。数据集2中的TMS条件（TMS2，使用固定强度刺激）也表现出从中等（单次试次61.32%）到高（20次试次77.62%）的准确度。TMS1的更高性能归因于其更高的信噪比（SNR），这得益于实时TEP引导的参数优化。对替代数据的分析证实，这种区分能力确实源于TEPs的信号结构，而非偶然或伪影。

3.1.2. 两个数据集共有的伪刺激条件显示出可变的准确度水平，但除AEP2外，其单次和平均试次准确度均低于TMS条件

在数据集1中，真实伪刺激（S1）和未掩蔽的听觉刺激（AEP1）达到了中等到高的准确度，而掩蔽的听觉刺激（AEPm1）则表现出低准确度。在数据集2中，未掩蔽的听觉刺激（AEP2）达到了中高准确度，但真实伪刺激（S2）和掩蔽的听觉刺激（AEPm2）的准确度都接近随机水平。重要的是，除了AEP2，所有共享的伪刺激条件的准确度都低于相应的TMS条件。

3.1.3. 各数据集独有的伪刺激条件显示出不同准确度

数据集1独有的高强度电刺激（HES1）表现出中高准确度。数据集2独有的低强度电刺激（LES2）准确度接近随机水平，而未掩蔽的TMS刺激（TMSnm2，即施加TMS但不掩蔽声音）则表现出与TMS相当甚至更高的中高准确度。

3.1.4. 单受试者分析及其他性能参数证实了组水平准确度的发现

单受试者水平的分析重复了组水平的结果趋势，表明组效应并非由少数个体驱动。灵敏度、特异性等指标也与准确度结果一致。交叉验证的结果与留一法结果相似，支持了模型的稳健性。

3.2. 条件间（TMS刺激前 vs. 伪刺激刺激前以及 TMS刺激后 vs. 伪刺激刺激后）比较

3.2.1. TMS与共有伪刺激条件的基线/刺激前比较导致低/随机水平的准确度

无论是数据集1还是数据集2，将TMS刺激前的EEG与各种伪刺激刺激前的EEG进行比较时，分类准确度都处于低或随机水平（通常低于60%），即使在平均20次试次后也只有边际提升。这表明在刺激施加之前，不同实验条件的脑电背景活动没有系统性差异。

3.2.2. TMS与共有伪刺激条件的刺激后比较产生了中等（单次试次）到高（20次试次）的准确度

与基线比较形成鲜明对比的是，将TMS刺激后的EEG与各种伪刺激（S1, AEP1, AEPm1, S2, AEP2, AEPm2）刺激后的EEG进行比较时，分类准确度显著提升。在数据集1中，单次试次准确度达到中等（68.96%-72.41%），平均20次试次后达到高准确度（88.77%-100%）。数据集2也观察到类似的从中等到高的准确度提升。

3.2.3. TMS与独有伪刺激条件的比较确认了条件间趋势，但TMS2与TMSnm2的刺激后比较除外

TMS与HES1、LES2等独有伪刺激的比较，也遵循了“基线无差异、刺激后可区分”的模式。一个关键的例外是TMS2与TMSnm2（未掩蔽的TMS）刺激后的比较，其准确度仅为低到中等水平。这说明，当TMS不进行声音掩蔽时，其诱发的响应（包含神经激活和听觉成分）与进行了声音掩蔽的TMS响应（主要包含神经激活成分）的差异变小，难以被机器学习有效区分。

3.2.4. 单受试者及其他性能参数证实了组水平准确度的发现

单受试者分析再次验证了组水平模式。其他性能指标也与准确度结果相符。

本研究通过应用BiLSTM机器学习模型，在两个独立的TMS-EEG数据集中系统地验证了真实TMS响应与多种伪刺激响应的可区分性。研究得出的核心结论是：源自TMS直接皮质激活的TEPs，可以在仅少数试次（约20次）后，以高精度与各种感觉混杂（听觉、体感）引起的响应区分开来，并且这种区分能力在个体水平上也普遍成立。这为TEPs的“真实性”提供了强有力的、数据驱动的客观证据。

讨论部分进一步阐释了这些发现的重要意义。首先，研究证实了优化实验流程（如使用实时TEP^rt-TEP引导、有效噪声掩蔽）对于提升TEP信噪比和机器学习分类性能的关键作用。其次，结果明确显示，有效的噪声掩蔽能显著抑制听觉诱发电位（AEP），使其响应变得难以与基线区分；而未掩蔽的听觉刺激则能被轻易识别。这直接支持了在TMS-EEG实验中严格进行听觉控制的重要性。第三，TMS与未掩蔽TMS（TMSnm2）响应之间的较低可区分性，恰恰反证了TMS本身确实产生了独特的、非听觉性的神经响应——因为如果TEP完全由听觉成分构成，那么掩蔽与否的TMS响应应该差异巨大而非相似。最后，该机器学习框架为解决TMS-EEG领域的长期争议提供了新工具。它表明，在妥善控制感觉混杂后，TMS诱发的早期至中期（约300毫秒）响应确实主要反映了对皮质的直接神经扰动，而非感觉通路上的附带产物。

总之，这项发表于《NeuroImage》的研究不仅开发并验证了一种客观评估TMS-EEG数据质量的新方法，更从计算分析的角度强化了TMS-EEG技术探测大脑固有生理特性的可靠性。它为推动TMS-EEG研究的标准化、提高其在基础和临床神经科学研究中的可信度与转化价值，奠定了重要的方法论基础。未来的方向包括在更多脑区、临床人群和不同实验设置中验证该方法的普适性，并探索将其整合到实时TMS-EEG监控系统的可能性。

热点排行

新闻专题