
-
生物通官微
陪你抓住生命科技
跳动的脉搏
SSDLabeler:用于脑电图(EEG)中多标签伪影分类的逼真半合成数据生成
《Scientific Reports》:SSDLabeler: realistic semi-synthetic data generation for multi-label artifact classification in EEG
【字体: 大 中 小 】 时间:2026年06月09日 来源:Scientific Reports 3.9
编辑推荐:
摘要脑电图(EEG)记录本质上会受到眼动、肌肉活动以及环境噪声等伪迹的干扰,这些伪迹会掩盖神经活动并使预处理变得复杂。伪迹分类方法在稳定性和透明度方面具有优势,是基于独立成分分析(ICA)方法的可行替代方案,能够与人工检查结合使用,并适用于多种应用场景。然而,伪迹分类的效果受到训
脑电图(EEG)记录本质上会受到眼动、肌肉活动以及环境噪声等伪迹的干扰,这些伪迹会掩盖神经活动并使预处理变得复杂。伪迹分类方法在稳定性和透明度方面具有优势,是基于独立成分分析(ICA)方法的可行替代方案,能够与人工检查结合使用,并适用于多种应用场景。然而,伪迹分类的效果受到训练数据的限制,因为该方法需要大量的手动标注工作,而这无法完全涵盖现实世界中脑电图数据的多样性。为了解决这一问题,研究人员提出了半合成数据(SSD)方法。但以往的方法通常仅使用ICA成分来模拟单一类型的伪迹,或者需要单独记录伪迹信号,这既降低了生成数据的真实性,也限制了该方法的应用范围。为了解决这些问题,我们开发了SSDLabeler框架:该框架通过ICA分解真实脑电图数据,利用均方根(RMS)和功率谱密度(PSD)标准进行伪迹验证,并将多种类型的伪迹重新注入到干净的数据中,从而生成具有真实感的、带有注释的半合成数据。在用于训练多标签伪迹分类器时,与传统的基于半合成数据或原始脑电图的数据训练方法相比,该方法在多种条件下的分类准确性得到了提升,为伪迹处理奠定了可扩展的基础,能够准确捕捉到真实脑电图数据中的伪迹共现现象及其复杂性。