
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于光电容积脉搏波(PPG)的可解释特征机器学习模型在睡眠-觉醒自动检测中的创新应用
【字体: 大 中 小 】 时间:2025年06月03日 来源:npj Biosensing
编辑推荐:
本研究针对睡眠障碍诊断中多导睡眠监测(PSG)成本高、侵入性强的问题,开发了一种基于光电容积脉搏波(PPG)信号的特征机器学习模型。通过提取330个特征并采用ADASYN平衡技术,随机森林模型在CAP睡眠数据库(84名受试者)中实现睡眠检测敏感性88.57%、特异性71.31%,为可穿戴设备提供了一种透明、低成本的远程睡眠监测方案。
睡眠质量与人类健康密切相关,全球约9.36亿人受睡眠呼吸暂停等疾病困扰。目前临床金标准多导睡眠监测(PSG)虽准确但价格昂贵,而基于加速度计的腕戴设备存在高估睡眠的问题。光电容积脉搏波(PPG)因其非侵入性和可穿戴性成为研究热点,但现有算法面临数据不平衡、可解释性差等挑战。针对这些问题,Karmen Markov等研究人员在《npj Biosensing》发表研究,通过机器学习方法开发了基于PPG信号的睡眠分期模型。
研究团队采用CAP睡眠数据库(84名受试者,85,542个30秒片段),通过Chebyshev滤波和MSPTD算法预处理PPG信号,提取330个涵盖时域、频域和非线性动力学特征。采用ADASYN解决数据不平衡问题,通过SelectFromModel筛选关键特征,最终建立随机森林分类器。模型验证采用20折交叉验证和留一法(LOSO)。
【模型评估】
在未平衡数据集中,模型F1分数达89.05%,但觉醒期特异性仅23.85%。经ADASYN平衡后,特异性提升至71.31%,AUC达0.8798。特别在发作性睡病(NL)组表现最佳(F1=87.92%),而失眠(INS)组效果较差(F1=68.79%),反映不同睡眠障碍的检测难度差异。
【特征重要性】
关键特征包括PPG波形偏度(PPG_skew)、修剪均值(PPG_TM25)和李雅普诺夫指数(PPG_LC)。平衡数据集更依赖心率变异性(HRV)频域特征,如PPI_LF_HF_power(低频/高频功率比),表明自主神经活动对睡眠-觉醒区分的重要性。
【讨论】
该研究首次系统验证了PPG特征在睡眠分期中的价值,相比既往使用原始信号的研究更具可解释性。创新性发现包括:1)PPG二阶导数特征(e_a_ratio)与睡眠状态显著相关;2)不同睡眠障碍需要特异性特征组合。尽管在失眠患者中表现欠佳,但为可穿戴设备提供了标准化分析框架。
这项研究的临床意义在于:1)建立了首个基于公开临床数据库的PPG睡眠分期模型;2)通过特征工程揭示了PPG信号与睡眠生理的关联机制;3)为家庭睡眠监测提供了可解释算法基础。未来工作需优化实时处理能力,并扩展至多阶段睡眠分类。
生物通微信公众号
知名企业招聘