野外环境中的SCG收缩期检测:一种静态-动态跨数据集分析方法

《Computers in Biology and Medicine》:SCG systolic detection in the wild: A static–dynamic cross-dataset analysis

【字体: 时间:2025年11月21日 来源:Computers in Biology and Medicine 6.3

编辑推荐:

  本研究采用U-Net模型分析真实场景中心冲击波(SCG)信号收缩复合体的检测,通过整合三个不同数据集(CEBS、MEC、BioPoli)构建实验框架,系统评估跨数据集(设备差异、主体异质性)和静态-动态域偏移(静止与运动状态)的影响。结果表明,多通道数据融合可提升检测性能,而个人化策略在动态场景中效果最佳,传统微调策略提升有限。首次验证了BioPoli真实场景数据对模型泛化的重要性,并提出了数据增强和筛选方法以应对运动伪影。

  ### 中文解读

近年来,随着可穿戴设备的普及,对心脏机械活动的连续监测技术获得了越来越多的关注。其中,**心震图(Seismocardiogram, SCG)**作为一种机械信号,能够反映心脏搏动引起的胸腔微小运动,为无创心脏活动分析提供了一种新途径。然而,SCG信号在实际应用中面临着诸多挑战,尤其是**域偏移(domain shift)**现象,这指的是在不同的环境或设备条件下,信号特征发生显著变化,从而影响模型的检测性能。因此,如何在不同场景下提升SCG信号中**收缩期复合波(systolic complex)**的检测能力,成为了当前研究的重点。

在以往的研究中,大多数基于深度学习(Deep Learning, DL)的SCG收缩期检测方法主要依赖于**控制环境下的数据集**,并且往往只关注单一数据集的实验分析。然而,现实世界中的情况更加复杂,用户可能在日常活动中佩戴传感器,如行走、运动等,这些都会对SCG信号产生干扰。因此,本研究提出了一种新的实验框架,用于**评估域偏移对无ECG(心电图)深度学习模型的影响**,并进一步探讨了传统模型适应策略(如微调和个性化)在不同场景下的效果。同时,还评估了**多通道方法**在现实场景中的优势。

### 研究背景

心脏活动的分析在许多医疗任务中具有重要意义,尤其是在心血管疾病的诊断与监测方面。目前,ECG信号被认为是研究心脏电活动的“黄金标准”,并且是临床中最常用的工具。然而,ECG信号并不能直接反映心脏的机械功能,而心脏的机械活动是评估心脏健康状况的重要指标之一。因此,研究者们开始关注SCG信号,希望通过其提供关于心脏机械活动的补充信息。然而,SCG信号的获取通常依赖于加速度计传感器,这使得其在**非控制环境中**极易受到**运动伪影(motion artifacts)**和**环境噪声**的影响,从而影响其准确性。

在SCG信号中,**收缩期复合波**是最重要的部分之一,它包含了心脏收缩时产生的机械事件。在理想条件下,通过ECG信号可以识别出收缩期复合波的关键点,如**主动脉瓣开放(Aortic Opening, AO)**,并将其作为定位的依据。然而,在非控制环境下,由于用户的活动不同,SCG信号的形态可能发生显著变化,使得基于ECG的识别方法不再适用。此外,某些情况下,AO点可能与舒张期的信号重叠,使得其识别变得更加困难。

### 研究目标

本研究的核心目标是评估**深度学习模型在现实场景中的适用性**,尤其是在**域偏移**条件下,其性能是否受到影响。为了实现这一目标,我们设计了一种**新颖的实验框架**,通过结合多个具有不同特性的数据集,模拟了**跨数据集域偏移**和**静态-动态域偏移**两种情况。其中,**跨数据集域偏移**指的是由于设备或传感器位置的不同,导致SCG信号的形态发生显著变化;而**静态-动态域偏移**则指的是在用户活动变化时,SCG信号受到的干扰更大,使得收缩期复合波的识别更加困难。

我们采用了一个**U-Net架构**,这是一种常用的卷积神经网络(CNN)结构,用于图像分割任务。通过这一架构,我们能够从SCG信号中自动识别出收缩期复合波的范围。为了提高模型的泛化能力,我们还引入了**微调(fine-tuning)**和**个性化(personalization)**两种模型适应策略。微调指的是在目标数据集上对模型进行进一步训练,以适应新的域特征;而个性化则指的是利用测试对象的部分数据进行模型优化,使其更适应该个体的特征。

此外,我们还探讨了**单通道**与**多通道**信号输入对模型性能的影响。在现实场景中,多通道信号可以提供更丰富的信息,从而提升模型的识别能力。然而,当用户处于动态活动时,多通道信号可能会引入额外的噪声,影响模型的稳定性。

### 实验设计与数据集

为了验证上述假设,我们使用了三个不同的数据集,分别代表了**控制环境**和**非控制环境**下的SCG信号。其中:

- **CEBS**:一个公开数据集,包含20名健康受试者在仰卧位下的SCG信号,采样频率为5 kHz,仅使用了Z轴加速度计数据。
- **MEC**:另一个公开数据集,包含29名健康受试者在仰卧位下的SCG信号,采样频率为800 Hz,使用了六通道传感器(三轴加速度计和三轴陀螺仪)。
- **BioPoli**:一个**专有数据集**,包含23名健康志愿者在非控制环境下的24小时连续ECG和SCG信号,采样频率为64 Hz,包含六通道数据(三轴加速度计和三轴陀螺仪)。

这些数据集在**采样频率**、**传感器类型**和**数据采集环境**上存在显著差异,为模拟不同的域偏移情况提供了理想的实验材料。此外,BioPoli数据集还包含了**步数计数信号**,可以用于区分用户在不同活动状态下的SCG信号。

### 信号预处理与标注

在信号处理阶段,我们首先对原始SCG信号进行预处理,包括**滤波**和**窗口分割**。为了去除噪声和呼吸伪影,我们采用了**四阶零相位带通巴特沃斯滤波器**,其中ECG信号的滤波范围为0.5–30 Hz,而SCG信号的滤波范围为5–25 Hz。随后,我们将信号分割为**5秒的窗口**,以确保每个窗口内包含多个心跳信号,从而更好地捕捉SCG信号的形态特征。

在标注方面,我们使用了**基于ECG的R波定位方法**,通过**Pan-Tompkins算法**识别ECG中的R波,并以此作为定位SCG中AO点的参考。随后,我们为每个AO点定义了一个**固定长度的25毫秒的边界框**,以表示收缩期复合波的范围。这种方法在没有ECG参考的情况下,仍然是目前主流的解决方案,因为它不依赖于特定的AO峰形态,而是通过**粗略分割标注**来提升模型的泛化能力。

### 模型训练与实验评估

在模型训练阶段,我们采用了一个**全卷积网络(Fully Convolutional Network, FCN)**,即**U-Net架构**,该架构包含**编码器**和**解码器**两部分。编码器通过多层卷积、批归一化(BatchNorm)和ReLU激活函数提取特征,而解码器则通过上采样(UpSampling)和跳接(skip connection)恢复特征的分辨率。整个训练过程使用了**二元交叉熵损失函数**和**Adam优化器**,并设定初始学习率为1e-4,训练至100个epoch。

为了进一步提升模型的性能,我们还引入了**数据增强策略**,即**通道交换(swapping data augmentation)**。该策略通过随机交换传感器的通道信息,避免模型对传感器方向的依赖,从而增强其泛化能力。此外,我们还采用了**统计选择(statistical selection)**和**步数选择(step-count selection)**两种方法,用于筛选出在非控制环境下表现较好的SCG信号。

在实验评估方面,我们设计了三种不同的实验设置:

1. **无域偏移(No-domain shift)**:所有训练和测试数据均来自同一数据集,即在相同条件下采集的信号。
2. **跨数据集域偏移(Cross-dataset domain shift)**:训练数据来自一个数据集,测试数据来自另一个数据集,以模拟传感器或采集环境的变化。
3. **静态-动态域偏移(Static–Dynamic domain shift)**:测试数据来自用户日常活动中的不同时间段,包括**静止**和**动态**两种情况。

在每种实验设置中,我们采用了**Leave-One-Subject-Out(LOSO)**交叉验证策略,以避免因个体差异(client heterogeneity)带来的偏差。通过这种方式,我们能够更全面地评估模型在不同域偏移条件下的表现。

### 实验结果

在**无域偏移**的实验设置中,我们发现**多通道方法**在BioPoli数据集上表现优于单通道方法,其F1分数达到了0.92,而单通道方法的F1分数仅为0.88。这表明,当用户处于动态活动时,多通道信号能够提供更丰富的信息,有助于模型更好地识别收缩期复合波。然而,在MEC数据集上,多通道和单通道方法的F1分数相近,这可能是因为MEC数据集中的信号已经是在控制环境下采集的,因此对模型来说,单通道信息已经足够。

在**跨数据集域偏移**的实验设置中,我们发现**多通道方法**在某些情况下表现优于单通道方法。例如,当MEC数据集作为训练集,BioPoli数据集作为测试集时,多通道方法的F1分数为0.93,而单通道方法仅为0.88。这表明,**多通道信号能够帮助模型适应不同采集环境下的域偏移**。然而,在其他情况下,如BioPoli数据集作为训练集,MEC数据集作为测试集时,多通道方法的性能反而有所下降,这可能是因为BioPoli数据集的信号更加复杂,包含了更多动态信息,而MEC数据集的信号相对简单。

在**静态-动态域偏移**的实验设置中,我们发现**模型性能显著下降**,尤其是在测试数据来自BioPoli数据集的**日常活动部分**时。例如,当训练数据来自BioPoli数据集的夜间部分,测试数据来自其日常活动部分时,模型的F1分数仅为0.60,而当训练和测试数据均来自日常活动部分时,F1分数提高至0.66。这表明,**在非控制环境下,用户活动的变化对SCG信号的识别带来了更大的挑战**。

此外,我们还发现**个性化(personalization)**和**微调(fine-tuning)**两种模型适应策略在一定程度上提升了模型的性能。特别是在BioPoli数据集上,个性化方法的表现优于微调方法,其F1分数提高了3%。这表明,**在非控制环境下,模型需要针对特定个体进行优化,以提升其检测精度**。

### 结果分析

从整体来看,**模型在无域偏移条件下表现最佳**,而在**跨数据集和静态-动态域偏移**条件下,其性能显著下降。这说明,**在现实场景中,模型的泛化能力受到极大的挑战**。特别是在静态-动态域偏移的情况下,由于用户活动的变化,SCG信号的形态受到严重影响,使得模型难以准确识别收缩期复合波。

为了进一步验证这一结论,我们还进行了**数据增强**实验。通过随机交换传感器的通道信息,我们发现**模型的泛化能力有所提升**,尤其是在MEC-BioPoli组合中,F1分数提高了约1%。这表明,**数据增强策略能够有效缓解域偏移带来的影响**,从而提升模型在不同场景下的适用性。

在**静态-动态域偏移**的实验中,我们发现**多通道方法并不总是最优选择**。例如,当测试数据来自**日常活动部分**,且训练数据来自**夜间部分**时,多通道方法的性能反而低于单通道方法。这可能是因为**多通道信号包含了与心脏活动无关的运动伪影**,从而干扰了模型的识别。然而,当训练数据来自**日常活动部分**时,模型能够更好地适应这些变化,从而在动态场景中表现更好。

### 研究意义与未来展望

本研究首次将**多通道方法**和**个性化策略**应用于现实场景下的SCG收缩期检测,为未来无ECG的SCG分析提供了新的思路。我们发现,**在非控制环境下,SCG信号的识别难度显著增加**,尤其是在用户处于动态活动时,运动伪影对模型的干扰尤为严重。因此,未来的SCG设备需要具备更强的**抗干扰能力**,以确保在各种环境下都能准确检测心脏活动。

此外,我们还发现,**在非控制环境下,模型的性能仍然受到个体差异的影响**。因此,**个性化策略**可能成为提升SCG检测性能的关键。未来的研究可以进一步探索如何在不依赖ECG的情况下,利用**个性化策略**提升模型的适应性。

### 实际应用的挑战与可能的解决方案

尽管深度学习在SCG收缩期检测中表现出色,但在现实场景中的应用仍面临诸多挑战。首先,**设备的多样性**可能导致信号采集条件的不同,从而影响模型的泛化能力。其次,**用户活动的多样性**使得SCG信号中包含大量运动伪影,这需要模型具备更强的抗干扰能力。此外,**数据采集的环境差异**也对模型的稳定性提出了更高的要求。

为了解决这些问题,未来的SCG设备可以采用**多通道信号融合**和**个性化模型优化**的方法。多通道信号能够提供更全面的信息,有助于模型更好地适应不同的采集环境。而个性化模型优化则可以针对特定用户进行调整,使其在不同活动状态下都能保持较高的检测精度。此外,**数据增强**和**模型微调**也可以作为有效的手段,提升模型在非控制环境下的适用性。

### 结论

本研究通过设计一种新颖的实验框架,探讨了深度学习模型在现实场景中检测SCG收缩期复合波的能力。我们发现,**在非控制环境下,模型的性能显著下降**,尤其是在用户处于动态活动时。因此,未来的SCG设备需要在**算法设计**和**数据采集**方面进行优化,以提升其在现实场景中的适用性。

此外,我们还验证了**多通道方法**和**个性化策略**在提升模型性能方面的有效性。这些方法在一定程度上缓解了域偏移带来的影响,使得模型能够在不同的采集环境下保持较高的检测精度。然而,**在动态场景中,多通道方法可能引入额外的噪声**,因此需要在模型设计时进行优化,以减少这种影响。

最后,我们指出,**在现实场景中,SCG信号的识别需要考虑多种因素**,包括信号的采集环境、传感器的类型和位置、用户的活动状态等。因此,未来的SCG研究应更加注重**现实场景下的数据采集和模型训练**,以确保其在实际应用中的可靠性。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号