《Frontiers in Physiology》:End-to-end non-invasive ECG signal generation from PPG signal: a self-supervised learning approach
编辑推荐:
本文提出了一种基于Transformer生成对抗网络(GAN)的创新框架,通过光电容积描记(PPG)信号生成心电图(ECG)信号。该模型结合自监督学习技术,在MIMIC III和Who is Alyx?数据集上分别将心率计算误差降低83.9%和72.4%,显著提升了动态心脏监测的可行性与准确性。研究还通过房颤(AF)检测任务验证了生成ECG的临床实用性,为可穿戴设备实现低成本、连续心脏监测提供了新思路。
引言:心血管疾病(CVDs)是全球主要死因,传统心电图(ECG)监测受限于临床环境。光电容积描记(PPG)作为可穿戴设备的常用技术,虽具便携性但信号细节不足。本研究旨在通过深度学习实现PPG到ECG的端到端生成,结合虚拟现实(VR)环境模拟真实运动场景,提升模型在复杂条件下的鲁棒性。
相关研究综述:早期研究多采用离散余弦变换(DCT)或循环生成对抗网络(CycleGAN)进行PPG-ECG转换,但存在泛化能力不足、对运动伪影敏感等问题。近年来,基于长短期记忆网络(LSTM)和Transformer的模型逐步应用于生物信号处理,但将Transformer整合至GAN框架用于PPG-ECG生成的研究尚属空白。自监督学习在ECG情感识别等任务中展现潜力,但其在PPG-ECG生成中的应用尚未深入探索。
研究方法设计:数据采集使用Polar H10胸带(ECG)和Empatica E4腕带(PPG),采样率分别为130 Hz和64 Hz。34名参与者在VR游戏《Half-Life: Alyx》中完成数据收集,模拟真实运动与情绪波动。同时采用MIMIC III和MIMIC PERform AF等公共数据集进行基准测试。预处理包括带通滤波(ECG: 0.5–45 Hz, PPG: 0.5–8 Hz)和分段归一化。
模型架构创新:生成器采用UNet-Transformer混合结构,卷积编码器提取局部特征,Transformer编码器通过自注意力机制捕捉长程时序依赖,解码器通过转置卷积重构ECG信号。判别器基于Transformer架构,引入Wasserstein损失与梯度惩罚解决模式坍塌问题。自监督预训练阶段通过六种信号变换(噪声添加、缩放、时序反转等)学习ECG表征,增强模型泛化能力。
实验结果分析:在留一法交叉验证(LOSO)下,模型在MIMIC III数据集上达到0.168 mV均方根误差(RMSE)和0.952皮尔逊相关系数(ρ),在Who is Alyx?数据集上达到0.22 mV RMSE和0.907 ρ。64秒窗口长度在运动伪影较多的数据中表现最优,96秒窗口在临床数据中效果最佳。生成ECG的心率计算误差较原始PPG降低72.4%以上。t-SNE可视化与最大均值差异(MMD2)检验表明生成ECG与真实ECG分布高度重叠。
房颤检测应用:使用双向LSTM(Bid-LSTM)和CNN-LSTM混合模型对生成ECG进行房颤分类。当训练数据中生成ECG占比100%时,模型仍保持89.2%的准确率;在纯生成ECG测试集上准确率达90.6%。基线波动分析显示生成ECG在0.05–9 Hz频段功率谱与真实ECG高度一致(RMSE<0.03 mV),证实其保留关键诊断信息的能力。
讨论与展望:本研究首次将Transformer-GAN与自监督学习结合用于PPG-ECG生成,在运动伪影丰富的场景中突破现有方法局限。未来工作将整合加速度计(ACC)数据优化运动噪声抑制,并探索模型在心律失常诊断、情绪识别等领域的扩展应用。