《Psychiatry and Clinical Neurosciences Reports》:Machine-learning classification of bipolar disorder incorporating wearable-derived core body temperature and actigraphy-derived sleep indices
编辑推荐:
目的:本研究旨在利用结合可穿戴设备衍生的核心体温(core body temperature, CBT)和体动记录仪衍生的睡眠指数的机器学习模型,对双相情感障碍(bipolar disorder, BD)患者和正常对照(normal controls, NCs
目的:本研究旨在利用结合可穿戴设备衍生的核心体温(core body temperature, CBT)和体动记录仪衍生的睡眠指数的机器学习模型,对双相情感障碍(bipolar disorder, BD)患者和正常对照(normal controls, NCs)进行分类。方法:研究人员招募了23名情绪稳定的BD患者和43名NCs。通过腕部体动记录仪连续14天收集睡眠参数,使用可穿戴设备连续3天测量CBT,以估计CBT最低点(CBT nadir)及其与睡眠指数的相位差。构建了基础模型(使用CBT和睡眠衍生特征)和扩展模型(纳入社会人口学变量)。特征经标准化(StandardScaler)处理,评估了随机森林(random forest)、LightGBM和XGBoost分类器。超参数通过训练数据内的交叉验证优化。采用重复嵌套交叉验证评估性能。在扩展模型中计算SHapley Additive exPlanations(SHAP)值以量化各特征对模型输出的相对贡献。结果:在MaxF1操作点的嵌套交叉验证中,基础模型的受试者工作特征曲线下面积(receiver operating characteristic curve–area under the curve, ROC–AUC)均值为0.771?±?0.162,扩展模型为0.930?±?0.050。在扩展模型中,SHAP提示总睡眠时间(total sleep time)、觉醒时间(wake time)和觉醒时间–CBT最低点相位差(wake time–CBT nadir phase difference)是与模型输出潜在相关的特征。结论:在这项小样本研究中,结合可穿戴设备衍生的CBT指数和体动记录仪衍生的睡眠参数的分类方法初步显示出区分BD与NC的能力。需要在更大样本、具有均衡背景特征(包括需要鉴别诊断的障碍)的队列中进行进一步验证。
双相情感障碍(bipolar disorder, BD)是一种以情绪高涨和抑郁交替发作为特征的复发性情感障碍,其症状随时间波动,需持续客观监测。传统监测方法如直肠测温在实践中有局限,可穿戴设备的发展提供了非侵入性替代方案。体动记录仪已用于评估BD患者的睡眠–觉醒节律紊乱,但核心体温(core body temperature, CBT)作为重要的昼夜节律相位标志,在BD研究中应用甚少。此前有研究指出,延迟睡眠–觉醒节律与BD相关,但CBT最低点与睡眠相位在BD中的关系尚不明确。为此,研究人员开展了一项探索性概念验证研究,旨在整合可穿戴设备衍生的CBT指数和体动记录仪衍生的睡眠参数,通过机器学习模型区分BD患者与正常对照(normal controls, NCs)。该研究发表于《Psychiatry and Clinical Neurosciences Reports》。
研究人员从琉球大学医院招募了23名情绪稳定的BD患者和43名NCs。主要技术方法包括:(1)使用腕部体动记录仪(ACCEL POLARIS,基于jerk算法)连续14天采集睡眠参数;(2)使用可穿戴CORE传感器连续3天监测皮肤温度,通过余弦分析(cosinor analysis)估计CBT最低点相位,并计算其与睡眠指标的相位差(上床时间–CBT最低点、中点–CBT最低点、觉醒时间–CBT最低点);(3)构建机器学习模型(随机森林、LightGBM、XGBoost),特征标准化后,采用嵌套交叉验证(内层5折×3重复,外层5折×5重复)优化超参数并评估性能;(4)使用SHapley Additive exPlanations(SHAP)值量化扩展模型(加入社会人口学变量)的特征贡献;(5)进行多变量线性回归分析调整混杂因素,并实施包括将CBT拟合优度(R
2 > 0.3)和助眠药使用作为协变量的敏感性分析。
研究结果如下:
参与者特征:与NC组相比,BD组年龄更小、教育年限更少、已婚比例更低、精神病家族史更常见、失眠严重指数(ISI)和残疾评定量表(WHODAS 2.0)得分更高,且就业状态分布差异显著(仅26.1%的BD患者在职,而NC组为95.3%)。
CBT和睡眠指标比较:组间比较显示,BD组的觉醒时间–CBT最低点相位差显著大于NC组(165.9 vs. 70.4 min,FDR校正p=0.013);BD组总睡眠时间更长(459.6 vs. 380.0 min,p<0.001)、睡眠中点更晚、觉醒时间更晚、觉醒时间变异度更大(均FDR p<0.05)。CBT最低点本身在两组间无显著差异。
多变量线性回归:在调整社会人口学因素后,诊断组(BD)与更长的觉醒时间–CBT最低点相位差、更长的总睡眠时间、更晚的觉醒时间独立相关(p<0.05)。已婚状态与更早的CBT最低点、更早上床时间和睡眠中点相关。
分类性能:嵌套交叉验证中,基础模型(仅睡眠+CBT特征)的ROC–AUC为0.771?±?0.162,扩展模型(加入社会人口学变量)升至0.930?±?0.050。在MaxF1操作点,扩展模型的准确率为0.751,敏感度0.633,特异度0.829。独立保留测试集(n=14)中基础模型ROC–AUC为0.933,扩展模型为1.000。
SHAP分析:扩展模型中贡献最大的七个特征依次为:就业状态、总睡眠时间、觉醒时间、婚姻状态、教育年限、觉醒时间变异度以及觉醒时间–CBT最低点相位差。
敏感性分析:采用CBT拟合优度R
2 > 0.3的标准以及纳入助眠药作为协变量时,结果与基础模型基本一致,AUC略有升高(分别至0.83和0.86)。
讨论部分指出,本研究首次将可穿戴CBT与体动记录仪睡眠指标整合于机器学习框架以区分BD与NC。觉醒时间–CBT最低点相位差的扩大可能主要反映觉醒时间延迟而非CBT相位偏移,这与延迟睡眠时相综合征(DSPS)中的观察一致。总睡眠时间延长也与BD缓解期的元分析证据相符。但研究存在重要局限:样本量小,BD与NC组在就业状态等社会人口学因素上不平衡,这些因素可能反映社会节奏差异而非疾病特异性;CBT记录时间仅3天,稳定性有限;研究仅比较健康对照,未纳入需要鉴别诊断的障碍(如重性抑郁障碍)。结论部分翻译如下:这项小样本、探索性概念验证研究表明,结合可穿戴设备衍生的CBT指数和体动记录仪衍生的睡眠参数的分类方法可能区分BD与NC。在调整协变量的分析和纳入社会人口学因素的模型可解释性评估中,觉醒时间–CBT最低点相位差、觉醒时间和总睡眠时间成为与BD–NC区分潜在相关的指标。然而,鉴于样本量较小、社会人口学不平衡可能带来残留混杂,以及研究设计聚焦于与健康对照的区别,当前发现应视为初步结果。未来需要在更大样本、背景特征更均衡匹配的队列,以及包含需要鉴别诊断障碍的临床丰富样本中进一步评估该方法的临床效用。