三种消费者级睡眠追踪设备的性能与活动记录法（Actigraphy）和多导睡眠图（Polysomnography）的对比

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Sleep Medicine》：Performance of three consumer sleep-tracking devices compared with Actigraphy and Polysomnography

【字体：大中小】 时间：2026年06月09日 来源：Sleep Medicine 3.4

编辑推荐：

沙特阿拉伯吉达国王阿卜杜勒-阿齐兹大学医学院内科呼吸科

摘要

目的

通过准确性、一致性和可靠性等互补指标，比较三种消费级可穿戴设备（Apple Watch Series 7、Fitbit Charge 5、Polar Vantage M2）与家庭多导睡眠图（PSG）和活动记录仪的检测性能。

方法

这项前瞻性观察研究在沙特阿拉伯吉达国王阿卜杜勒-阿齐兹大学医院进行，研究对象为18至45岁的健康成年人。参与者被随机分配到不同的可穿戴设备组（Fitbit组n=20人；Apple Watch组n=19人；Polar组n=15人）。在家庭环境中进行PSG检测，并同时佩戴研究级活动记录仪（持续7天）作为参考数据。主要评估指标包括睡眠时间（TIB）、总睡眠时间（TST）以及睡眠阶段（快速眼动期REM、浅睡眠期、深睡眠期）的差异。一致性通过组内相关系数（ICCs）和Bland–Altman分析进行评估。

结果

总体而言，这些可穿戴设备与PSG的结果一致性较低，且存在较大误差范围。与PSG相比，Fitbit高估了浅睡眠时间（+57.7 ± 80.5分钟，P = 0.009）；Apple Watch低估了浅睡眠时间（–73.8 ± 61.6分钟，P < 0.001），并高估了快速眼动期时间（+30.3 ± 36.3分钟，P = 0.003）；Polar在快速眼动期数据上存在正向偏差（+32.3 ± 43.6分钟，P = 0.026），其他参数无显著差异。综合排名中，Apple Watch表现最佳，其次是Fitbit和Polar。

结论

Apple Watch Series 7、Fitbit Charge 5和Polar Vantage M2在特定参数上存在偏差，与PSG和活动记录仪的结果一致性有限。这些设备更适合用于长期自我监测，而非临床级别的睡眠结构评估。

引言

充足的优质睡眠对整体健康至关重要，可改善心肺代谢功能、神经认知能力、情绪调节以及白天的表现[1]。正常的睡眠结构非常复杂，包括非快速眼动期（NREM）和快速眼动期（REM）之间的循环转换，这种转换遵循两个主要驱动过程——S过程（稳态睡眠驱动力）和C过程（昼夜节律）的相互作用，它们共同调节我们的睡眠-觉醒周期，影响我们感到困倦的时间和睡眠时长[2]。睡眠模式和时长的任何紊乱都可能导致多种身心问题，严重影响生活质量[3]。因此，评估睡眠时长和结构对于了解睡眠障碍的性质和程度非常重要。多导睡眠图（PSG）被广泛认为是评估睡眠连续性和结构的金标准[4]。活动记录仪结合加速度计和算法，可以在自然环境中长时间记录睡眠数据，作为客观睡眠评估的替代方法[5]。

近年来，诸如手表、手环和戒指等消费级可穿戴设备因低成本、易于使用以及作为标准睡眠评估方法的可行且可扩展的替代方案而受到广泛关注[6]。这些设备利用加速度计或光学脉搏血氧饱和度传感器检测生物信号，然后通过经过验证的算法处理和分析这些数据，以估计睡眠模式和潜在的睡眠障碍[7]。然而，尽管这些设备很受欢迎且使用广泛，但其在提供准确睡眠指标方面的准确性和可靠性仍存在争议[8]、[9]、[10]、[11]。此外，大多数研究仅关注单一可穿戴设备或少数睡眠参数的评估[12]。

最近的社区调查显示，沙特人群中睡眠障碍普遍存在，包括睡眠时长不足、睡眠规律性差、入睡延迟等问题，这些因素显著增加了心血管和代谢疾病的风险[12,13]。当地研究还表明，年轻、受教育程度高且在职的人群中，使用智能睡眠记录设备和应用程序的情况较为普遍[14,15]。沙特人群具有独特特征，可能影响西方或东亚人群研究结果的普遍性，例如文化及宗教习俗（如夜间社交活动和清晨祈祷）、肥胖和代谢疾病的高发率，以及肤色多样性，这些都可能影响可穿戴设备中光学脉搏血氧饱和度传感器的准确性。这些因素表明，需要针对特定地区对消费级可穿戴睡眠设备进行验证。为了解决这一问题，我们进行了本研究，使用多维和全面的评估框架，比较了三种常用消费级可穿戴设备（Apple Watch Series 7、Fitbit Charge 5和Polar Vantage M2）与PSG和活动记录仪的检测性能。

研究片段

研究设计和地点

这项单中心前瞻性观察研究于2022年7月至2023年5月在沙特阿拉伯吉达的国王阿卜杜勒-阿齐兹大学医院（KAUH）进行。

参与者和招募

通过社区会议、口口相传和社交媒体平台招募了18至45岁的健康成年志愿者。参与研究不提供任何经济奖励。研究团队成员对参与者进行了筛选。

参与者特征

共有54名参与者纳入分析（Fitbit组n=20人；Apple Watch组n=19人；Polar组n=15人）。不同设备组之间的性别分布存在差异，Fitbit组和Polar组的女性比例较高（分别为80.0%和66.7%），而Apple Watch组为47.4%，但这种差异无统计学意义（P = 0.109）。平均年龄分别为Fitbit组24.5 ± 5.7岁，Polar组27.9 ± 9.0岁，两组间无显著差异。

讨论

本研究通过准确性、一致性和可靠性等指标，评估了三种常用消费级可穿戴设备与多导睡眠图和活动记录仪的检测性能。总体而言，不同设备在睡眠参数上的估计结果存在较大差异，且存在明显的参数特异性偏差，与参考标准的一致性有限。尽管在某些指标上某设备的表现略优于其他设备，但总体而言，这些设备的睡眠评估能力仍存在局限性。

伦理审批和参与同意

研究方案已获得KAUH研究伦理委员会/生物医学伦理部门的批准（参考编号：135-22）。所有参与者在研究开始前均签署了书面知情同意书。

发表同意

所有作者均已阅读手稿最终版本，并同意发表。

数据和材料的获取

数据可应合理要求提供。

资金支持

沙特阿拉伯吉达国王阿卜杜勒-阿齐兹大学的科学研究部（DSR）资助了该项目（项目编号：RG-19-140-42）。

CRediT作者贡献声明

法里斯·阿尔赫贾伊利（Faris Alhejaili）：概念构思、数据整理、数据分析、资金申请、研究设计、方法论制定、初稿撰写及审稿编辑。兰雅·阿尔舒姆拉尼（Ranya Alshumrani）：概念构思、数据整理、研究设计、方法论制定、初稿撰写及审稿编辑。瓦伊尔·阿拉穆迪（Wail Alamoudi）：概念构思、数据整理、方法论制定、初稿撰写及审稿编辑。西拉杰·瓦利（Siraj Wali）：概念构思、数据整理、方法论制定。

利益冲突声明

作者声明没有已知的可能影响本文研究的财务利益或个人关系。D.G.获得了美国国立卫生研究院的资助。

致谢

本手稿由沙特阿拉伯吉达国王阿卜杜勒-阿齐兹大学医院的临床研究协调员瓦拉·阿布扎赫拉（Walaa Abuzahra）准备并提交。

联系信箱：

粤ICP备09063491号

摘要

目的

方法

结果

结论

引言