一种基于脉搏血氧饱和度信号的深度学习方法,可用于解释所有年龄段的睡眠呼吸暂停患者的睡眠分期过程

《Engineering Applications of Artificial Intelligence》:An explainable deep learning approach for sleep staging in sleep apnea patients across all age subgroups from pulse oximetry signals

【字体: 时间:2025年10月06日 来源:Engineering Applications of Artificial Intelligence 8

编辑推荐:

  睡眠障碍自动分级模型POxi-SleepNet基于U-Net架构,利用脉搏率(PR)和血氧饱和度(SpO2)信号实现四类睡眠阶段(清醒、浅睡、深睡、快速眼动)的跨年龄段自动评分,并通过可解释性AI方法Seg-Grad-CAM定量分析PR和SpO2的时间及频域特征。在覆盖儿童至老年人的6个独立数据集(共17303例睡眠研究)中,模型准确率达81.5%-84.5%,Cohen's κ值0.726-0.779,验证了其高精度和泛化能力。研究首次结合深度学习与可解释性分析,揭示PR和SpO2在0.004-0.020Hz、0.020-0.100Hz和0.180-0.400Hz频段及时间域(均值、标准差、RMSSD)的差异特征,为临床提供可理解的自动睡眠分级工具。

  在睡眠医学领域,自动化睡眠分期技术的发展已成为研究的热点,特别是在睡眠呼吸暂停(OSA)患者中。随着深度学习(DL)技术的不断进步,科学家们正在探索如何利用脉搏血氧饱和度(SpO?)和脉搏率(PR)信号来开发高效的睡眠分期模型。这些信号可以通过无创的可穿戴设备轻松获取,这为在家庭环境中进行睡眠监测提供了便利。然而,这些模型在解释性和泛化能力方面仍然面临挑战,尤其是在不同年龄段的患者中。为了应对这些挑战,研究者们提出了一种基于U-Net架构的深度学习模型,称为POxi-SleepNet,旨在准确地进行四类睡眠分期(清醒、轻度睡眠、深度睡眠和快速眼动睡眠),并结合可解释人工智能(XAI)方法,如Seg-Grad-CAM,以揭示影响睡眠分期的关键时间域和频率域特征。

### 研究背景与意义

睡眠分期是评估和诊断睡眠相关疾病的关键步骤,尤其对于OSA的诊断具有重要意义。OSA是一种影响全球约10亿人的常见睡眠障碍,其诊断依赖于每小时的呼吸暂停和低通气指数(AHI),这需要精确的睡眠分期来计算总睡眠时间和特定异常的分布。传统的睡眠分期依赖于多导睡眠图(PSG)记录,但PSG具有复杂性、高成本、高度侵入性和有限的可及性,这些因素限制了其在临床中的广泛应用。因此,开发一种基于少数通道的自动化睡眠分期模型,以提高一致性、简化流程并降低成本,成为研究的重点。

此外,睡眠分期通常由睡眠技术人员手动完成,涉及电图(EEG)、眼电图(EOG)和颏下肌电图(EMG)信号,以及PSG期间的其他心肺数据。这一过程不仅耗时,而且主观性强,不同评分者之间存在显著的差异,可能影响诊断的准确性。为了提高诊断的客观性和可靠性,研究者们正在探索使用深度学习算法来自动处理脉搏血氧饱和度和脉搏率信号,以进行睡眠分期。

### 方法与技术细节

研究团队使用了来自六个不同半公开数据集的17303次PSG研究,涵盖儿童、青少年、成人和老年OSA患者。这些数据集包括Cleveland Children's Sleep and Health Study(CCSHS)、Cleveland Family Study(CFS)、Childhood Adenotonsillectomy Trial(CHAT)、Multi-Ethnic Study of Atherosclerosis(MESA)、Osteoporotic Fractures in Men Study(MrOS)和Sleep Heart Health Study(SHHS)。每个数据集被随机划分为训练集(最多50%的受试者)、验证集(大约25%的训练集)和测试集(至少50%的受试者),用于模型训练、调整和评估。

为了提高模型的泛化能力,研究团队采用了三种不同的实验策略:标准划分(SHO)、留一队列(LOCO)和留一队列微调(LOCO-FT)。这些策略分别用于评估模型在不同年龄组的泛化能力。POxi-SleepNet模型基于U-Net架构,该架构最初用于图像分割,但已被证明在睡眠分期任务中具有良好的效果。模型的输入包括标准化的PR和SpO?信号,这些信号被统一采样为1 Hz,并在必要时进行零填充或截断以确保所有记录都具有12小时的长度。模型的输出为四类睡眠阶段的概率分布,即清醒、轻度睡眠、深度睡眠和快速眼动睡眠。

为了增强模型的可解释性,研究团队应用了Seg-Grad-CAM方法,该方法通过梯度加权的类激活映射,生成热图以可视化模型决策的关键区域。热图的计算基于选定的卷积层,将梯度与特征图结合,以突出显示对预测睡眠阶段至关重要的时间域和频率域特征。通过这种方法,研究人员能够识别出PR和SpO?信号在不同睡眠阶段中的变化,并进一步分析这些变化对睡眠分期的影响。

### 结果与分析

POxi-SleepNet模型在所有六个数据集上的表现均显示出高精度,准确率在81.5%到84.5%之间,Cohen's kappa值在0.726到0.779之间。这些结果表明,该模型在不同年龄段的OSA患者中具有良好的泛化能力。与仅使用PR或SpO?信号的模型相比,POxi-SleepNet在使用PR和SpO?信号的组合时表现出更高的性能,这说明两种信号在睡眠分期中具有互补性。

在时间域分析中,PR和SpO?信号的均值、标准差(SD)和根均方差(RMSSD)被计算出来,以评估不同睡眠阶段的变异性。结果显示,清醒阶段的PR和SpO?信号具有较高的变异性,而深度睡眠和快速眼动睡眠的变异性较低。在频率域分析中,研究团队通过连续小波变换(CWT)计算了PR和SpO?信号的功率谱密度(PSD),并识别出三个主要的频率带:0.004–0.020 Hz(BW_PR1和BW_SpO2-1)、0.020–0.100 Hz(BW_PR2和BW_SpO2-2)以及0.180–0.400 Hz(BW_PR3和BW_SpO2-3)。这些频率带在不同睡眠阶段中表现出不同的特征,例如,清醒阶段在BW_PR1和BW_SpO2-1中表现出较高的活动性,而深度睡眠和快速眼动睡眠在BW_PR2和BW_SpO2-2中具有较高的活动性。

### 讨论与结论

POxi-SleepNet模型的高准确率和良好的泛化能力表明,基于PR和SpO?信号的深度学习模型在睡眠分期中具有广阔的应用前景。特别是在家庭环境中,这些模型可以显著减少对PSG设备的依赖,提高诊断的便捷性和可及性。此外,结合XAI方法,如Seg-Grad-CAM,不仅能够提高模型的透明度,还能帮助临床医生更好地理解和解释模型的决策过程,从而提高其在实际应用中的可信度和接受度。

然而,研究也指出了一些局限性。首先,尽管样本量较大,但大多数患者为成年人,仅有少数数据来自儿童,这可能影响模型在儿童群体中的泛化能力。其次,模型未考虑其决策的不确定性,这可能限制其在临床中的应用。未来的研究可以探索如何量化模型的不确定性,以识别错误分类的时期并提高睡眠分期的准确性。此外,研究团队还提到,可以进一步扩展模型的应用范围,以涵盖其他睡眠障碍,如失眠、发作性睡病和快速眼动睡眠障碍。

综上所述,POxi-SleepNet模型结合了深度学习和可解释人工智能技术,能够有效进行睡眠分期,并在不同年龄段的OSA患者中表现出良好的性能。这种方法不仅提高了睡眠分期的自动化水平,还增强了模型的透明度和临床适用性,为未来睡眠医学的发展提供了新的思路和工具。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号