
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于可穿戴设备运动数据的机器学习模型验证:睡眠模式变异性与早产预测的关联研究
【字体: 大 中 小 】 时间:2025年06月22日 来源:npj Women's Health
编辑推荐:
本研究针对早产(PTB)预测中自报告睡眠数据的局限性,创新性地利用智能手表采集的运动数据(actigraphy),通过机器学习模型分析妊娠期睡眠模式变异性与PTB的关联。研究团队开发了基于高斯朴素贝叶斯(Gaussian NB)的预测模型,发现睡眠起始时间变异性(day-to-day variability between sleep start)是最具预测力的特征,结合临床问卷数据可使预测AUC达0.724。该研究为无创性早产预警提供了新思路,相关成果发表于《npj Women's Health》。
早产(Preterm Birth, PTB)作为妊娠期最严重的并发症之一,每年导致全球约100万5岁以下儿童死亡。尽管已知睡眠紊乱与PTB存在关联,但传统依赖孕妇自述的睡眠评估方法存在回忆偏差和准确性不足的问题。随着可穿戴设备的普及,通过智能手表连续采集高精度运动数据(actigraphy)为破解这一难题提供了新机遇。华盛顿大学医学院联合BJC医疗集团的研究团队开展了一项开创性研究,首次系统验证了基于可穿戴设备运动数据的机器学习模型对PTB的预测效能。
研究团队从1523名孕妇队列中筛选出665名具有有效运动数据的参与者,使用CamNtech MotionWatch 8设备在三个妊娠期各采集2周的运动数据。通过创新性地提取睡眠周期变异性特征(如睡眠起始时间标准差、每日活动计数变异等),结合临床问卷数据,构建了包括高斯朴素贝叶斯(Gaussian NB)、支持向量机(SVM)和XGBoost在内的多种机器学习模型。
关键技术方法包括:1) 多中心前瞻性队列设计,纳入华盛顿大学医学中心妊娠20周内的单胎孕妇;2) 分钟级运动数据采集与日水平特征工程,提取均值/标准差等统计量;3) 采用最小冗余最大相关(mRMR)算法筛选临床特征;4) 5折交叉验证比较不同机器学习模型性能;5) SHAP值分析特征重要性。
研究结果
Gestational age and model performance
模型性能随妊娠周期呈现波动性变化,完整妊娠期数据使AUROC提升至0.724。这种波动可能与不同妊娠期样本量差异有关,如图1所示,第三 trimester阳性样本仅46例。
Feature explanations
SHAP分析揭示:1) 既往分娩并发症是最强预测因子;2) 社会经济特征(种族、就业状况)位列第二;3) 运动数据特征中,睡眠起始时间变异性(day-to-day variability between sleep start)最具预测力,其SHAP值显著高于睡眠时长等静态指标。如图4所示,这些发现与轮班工作致PTB风险升高的临床观察相吻合。
First-time/nulliparous pregnancies
针对初产妇的亚组分析显示,当排除既往分娩史特征后,运动数据模型的AUROC达0.677,显著优于仅用临床问卷的模型(0.537)。如图6所示,此时睡眠周期中点的变异性(halfway between sleep start and sleep end的标准差)成为首要预测指标。
讨论与意义
该研究首次证实可穿戴设备运动数据可作为PTB的独立预测指标,其中睡眠模式变异性较绝对睡眠参数更具临床价值。值得注意的是,架构简单的Gaussian NB模型表现最优(AUROC 0.724),暗示各特征间可能存在独立性。这一发现为开发低计算成本的临床预测工具提供了方向。
对临床实践的启示在于:1) 对初产妇应重点监测睡眠规律性;2) 社会经济因素需纳入风险评估体系;3) 智能手表可实现无创、连续的PTB预警。研究局限性包括样本量不足(尤其第三trimester)和未处理非数值型特征。未来研究应扩大队列规模,并探索深度学习对原始时间序列数据的挖掘潜力。
该成果发表于《npj Women's Health》,为数字表型分析(digital phenotyping)在围产医学的应用树立了新范式。通过将消费级可穿戴设备转化为临床研究工具,为早产机制研究和干预策略开发提供了创新性技术平台。
生物通微信公众号
知名企业招聘