评估输入噪声和基于ERP的惩罚机制对使用WGAN-GP生成脑电图(EEG)的生理合理性的影响
《Computers in Biology and Medicine》:Evaluating the impact of input noise and ERP-based penalties on the physiological plausibility of EEG generation using WGAN-GP
【字体:
大
中
小
】
时间:2025年11月22日
来源:Computers in Biology and Medicine 6.3
编辑推荐:
本研究利用WGAN-GP生成脑电图(EEG)信号,探讨输入噪声类型(白噪声vs.1/f噪声)和ERP惩罚带宽对生成信号时频特征的生理合理性影响。结果表明,1/f噪声输入能更好地匹配EEG频谱特性,而白噪声结合0.5-5Hz ERP惩罚可优化时域波形。两种噪声需配合不同ERP惩罚参数,平衡时频特征与训练效率,为认知研究提供数据增强方案。
生成人工脑电图(EEG)信号是当前神经科学研究和医学诊断领域的一个重要技术手段,而生成对抗网络(GANs)因其强大的生成能力,在该领域得到了广泛应用。然而,尽管GANs能够生成类似真实数据的信号,但其生成信号的生理合理性(physiological plausibility)往往被忽视。生理合理性对于确保生成信号在研究和临床应用中的可信度至关重要。本文通过一种名为Wasserstein GAN with gradient penalty(WGAN-GP)的模型,首次系统地探讨了输入噪声类型(白噪声与1/f噪声)和基于事件相关电位(ERP)的惩罚机制对生成EEG试次(trials)生理合理性的影响。研究结果表明,不同噪声类型和惩罚机制对生成信号的特性存在显著影响,而选择合适的输入噪声和惩罚策略对于生成具有生理合理性的EEG至关重要。
在神经科学研究中,EEG是一种无创的脑神经活动记录技术,被广泛用于探索认知功能和检测神经系统疾病。然而,实际实验中,由于受试者在长时间测试中容易产生疲劳,获取足够高质量的EEG数据变得困难。特别是在研究注意力分散(mind-wandering)这类现象时,受试者通常只能接受有限时间的测试,导致数据采集受限,影响研究的深度和广度。因此,生成符合生理特征的EEG数据成为解决这一问题的潜在方法。然而,如何选择合适的输入噪声类型和惩罚机制,使得生成的EEG在时间域和频率域都具有合理的特征,是当前研究的重点。
本文研究中使用的WGAN-GP模型,是一种改进的GAN结构,它通过引入Wasserstein距离(WD)和梯度惩罚(gradient penalty)来提升训练的稳定性,并减少生成信号中的模式坍塌(mode collapse)现象。在模型训练过程中,输入噪声类型被设定为白噪声或1/f噪声。白噪声具有恒定的功率谱密度(PSD),而1/f噪声则更接近真实EEG的典型频谱分布。研究发现,使用1/f噪声作为输入的模型在生成信号的频谱特征上表现更优,特别是在抑制高频振荡(high-frequency oscillations)方面,其生成的EEG信号更接近真实EEG。然而,对于某些特定的频率范围,例如0.5–5 Hz,ERP惩罚机制能够进一步优化模型,减少不必要的高频振荡,从而提升ERP波形和频谱的一致性。相比之下,使用白噪声输入的模型在某些频率范围内可能引入高频振荡,但通过ERP惩罚,可以有效缓解这一问题。
为了评估生成信号的生理合理性,研究采用了多种方法。首先,通过视觉检查ERP波形和频谱(PS)来评估生成信号的外观和结构是否与真实信号相似。其次,利用统计学方法对EEG特征进行比较,包括频段功率、熵值、P3波幅和潜伏期、Petrosian分形维度(PFD)和Hjorth复杂度(HC)。此外,研究还采用了主成分分析(PCA)、t-distributed stochastic neighbor embedding(t-SNE)和核密度估计(KDE)等方法,对生成信号的特征分布进行可视化分析,以判断其与真实数据的相似性。同时,通过分解周期性(oscillatory)和非周期性(aperiodic)成分,进一步量化分析信号的频谱结构。
研究结果表明,WGAN-GP模型在使用1/f噪声输入时,能够更好地保留EEG的频谱特性,同时减少不必要的高频振荡。而ERP惩罚机制则主要适用于使用白噪声输入的模型,尤其是0.5–5 Hz频段的惩罚能够显著改善ERP波形和频谱的匹配度。然而,对于使用1/f噪声输入的模型,ERP惩罚有时反而会影响频谱特征,甚至引入新的振荡现象。这表明,输入噪声和惩罚机制之间存在一种权衡关系,选择合适的组合对于生成具有生理合理性的EEG至关重要。
此外,研究还探讨了输入噪声类型和ERP惩罚机制对生成信号特征分布的影响。例如,在使用白噪声输入的模型中,0.5–10 Hz频段的ERP惩罚能够使模型学习到更多的特征,而0.5–3 Hz和0.5–5 Hz频段的惩罚虽然能够减少高频振荡,但可能会对某些特征,如P3潜伏期,造成不利影响。相比之下,使用1/f噪声输入的模型,即使不加入ERP惩罚,其生成的信号在频谱特征上也表现出更高的相似性。然而,对于ERP波形的生成,1/f噪声输入的模型仍然存在一定的局限性,需要进一步的优化。
研究还发现,模型的训练时间和频率域特征之间存在一定的权衡。使用1/f噪声输入的模型在生成信号的频谱特征上表现更优,但可能需要更多的训练时间来达到稳定。而使用白噪声输入的模型,虽然在训练时间上较短,但可能在频谱特征上表现不佳,需要通过ERP惩罚来弥补这一缺陷。因此,输入噪声和ERP惩罚的选择应基于具体的应用需求,例如,如果研究重点在于ERP波形和频谱的匹配度,则选择白噪声输入并结合0.5–5 Hz频段的ERP惩罚可能是最佳策略;而如果研究目标是全面的生理特征分布,则使用1/f噪声输入并结合0.5–3 Hz频段的ERP惩罚可能更合适。
综上所述,本文通过系统地评估输入噪声类型和ERP惩罚机制对生成EEG信号的影响,揭示了在不同输入条件下,模型生成信号的生理合理性存在显著差异。研究结果表明,1/f噪声输入的模型在频谱特征上表现更优,而ERP惩罚机制在使用白噪声输入时效果更为显著。然而,对于某些特定的频率范围,ERP惩罚可能会影响生成信号的特征分布,甚至引入新的振荡现象。因此,在实际应用中,选择合适的输入噪声和惩罚机制是生成具有生理合理性的EEG信号的关键。未来的研究可以进一步探索多通道EEG生成的方法,以捕捉更全面的神经活动特征,同时也可以尝试将ERP惩罚与其他生成模型(如VAE、扩散模型、Transformer等)结合,以提升生成信号的质量和多样性。此外,还可以进一步研究如何优化ERP惩罚的频率范围,以更好地平衡时间域和频率域的特征匹配。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号