编辑推荐:
不宁腿综合征(RLS)诊断依赖主观报告,精准诊断困难。研究人员开展基于数字表型的 RLS 预测机器学习模型研究。结果显示不同模型对不同症状组预测各有优势,该研究为 RLS 早期检测和个性化管理提供依据。
在繁忙的现代生活中,人们越来越关注自身健康,然而有一种疾病却常常被忽视或误诊,它就是不宁腿综合征(Restless Legs Syndrome,RLS)。RLS 是一种相对常见的神经感觉障碍,患者会有难以抑制的腿部运动冲动,这种病症不仅严重干扰睡眠,降低生活质量,还与代谢失调、心血管疾病等存在关联。但目前 RLS 的诊断面临诸多难题,主要依赖患者主观报告,缺乏特异性生物学检测,且症状多变,容易与其他疾病混淆,睡眠相关问卷的可靠性也受主观回忆影响,导致许多患者在出现症状多年后才得到准确诊断,因此急需新的诊断工具。
在此背景下,韩国大学(Korea University)的研究人员展开了深入研究。他们旨在构建基于数字表型的机器学习预测模型,用于 RLS 的诊断。该研究成果发表在《Scientific Reports》上,为 RLS 的诊疗带来了新的曙光。
研究人员采用了多种关键技术方法。在样本方面,从韩国大学和 Datamaker 招募了 338 名参与者,包括 119 名失眠患者和 89 名正常睡眠者。通过可穿戴设备(如 Fitbit Inspire 1 或 2)收集步数、心率、睡眠等客观生物特征数据,同时让参与者使用名为 “SOMDAY” 的智能手机应用程序记录饮酒、咖啡因摄入、午睡习惯等生活方式数据。对收集到的数据,基于昼夜节律进行处理,最终获得 85 个特征。在模型构建上,运用了随机森林(RF)、极端梯度提升(XGB)和 Light Gradient Boosting Method(LGBM)等树状机器学习模型进行预测,并使用 Shapley Additive exPlanations(SHAP)值分析变量重要性 。
下面来看具体的研究结果:
- 参与者基线特征:RLS 症状组与对照组相比,在多个方面存在差异。工作日最活跃 10 小时步数(M10)更少,节假日相对振幅(RA)更低;睡眠方面,总睡眠、REM 睡眠和深度睡眠时间更长;夜间心率最大值更低,压力水平更高,酒精摄入量更少。严重 RLS 症状组与对照组相比,步数以余弦分析的特征(如 MESOR、振幅)更低,多个时段的步数、运动时间和步行距离更少,夜间心率更低,酒精摄入量也显著降低。
- RLS 预测模型性能评估:在预测 RLS 症状组时,仅使用可穿戴设备数据,RF 模型的 AUC 为 0.78;结合可穿戴设备和应用程序数据后,RF 模型 AUC 提升至 0.86,表现最佳。在预测严重 RLS 症状组时,仅用可穿戴设备数据,XGB 模型 AUC 为 0.66;结合两种数据后,XGB 模型 AUC 达到 0.70,性能最优。此外,使用基于 SHAP 值的前 20 个特征构建的精炼模型,整体性能有所提升。
- 特征重要性分析:SHAP 分析显示,压力、步数相关特征(如节假日和工作日的 M10 等)对 RLS 症状组预测影响较大;而最大夜间心率、步数相关特征(如节假日和工作日的 M10 等)在严重 RLS 症状组预测中较为关键。
研究结论和讨论部分指出,该研究首次将数字表型应用于 RLS 预测,在不同特征设置下取得了较为满意的预测准确率 。虽然数字表型仅利用日常生活数据,存在一定局限性,但研究人员通过纳入与 RLS 相关的多种因素(如心理、生活方式、身体和昼夜节律因素),提升了模型性能。研究还发现 RLS 与昼夜节律、压力、睡眠碎片化等密切相关。不过,该研究也存在一些不足,如年龄分布不均、样本量有限且不平衡、未调整部分医学状况等 。尽管如此,该研究依然为 RLS 的早期检测和个性化管理奠定了基础,推动了数字健康技术在神经精神疾病管理中的应用,有望助力个性化医学的发展,为后续研究指明了方向,如扩大样本规模、纳入更多临床特征等,以进一步完善 RLS 的诊疗策略。