基于模式聚类和数字生物标志物提取的自由生活体力活动分析:解锁健康密码的新钥匙

【字体: 时间:2025年02月10日 来源:BioData Mining 4

编辑推荐:

  为解决自由生活体力活动(PA)数据分析难题,如缺乏活动标签、传统方法难以捕捉个体活动模式细节等问题,研究人员开展了 PA 模式聚类和数字生物标志物提取的研究。结果显示该方法能有效捕捉 PA 模式与疾病结果的关联,对个性化健康评估和疾病检测意义重大。

  在现代健康研究领域,体力活动(Physical Activity,PA)对人体健康的影响备受关注。世界卫生组织(WHO)将 PA 定义为任何消耗能量的身体运动,它涵盖了从日常家务到休闲运动等各种活动。大量研究表明,PA 与疾病、特定人群健康、睡眠、休息 - 活动节律以及疾病管理和预防都有着密切联系。
随着科技的进步,可穿戴设备的普及使得收集真实世界的 PA 数据变得容易。然而,这些数据缺乏活动类型标签,研究人员通常只能计算 PA 强度单位,如活动计数、ENMO、信号向量幅度(SVM)等,并基于这些数据得出时域和频域的统计量,将其作为数字生物标志物用于分析。但这些统计量无法描述短于一天时间间隔内的时间模式,难以揭示特定活动行为对健康的影响。因此,定义更具信息性的数字生物标志物,以更好地理解 PA 与健康的关系,成为了亟待解决的问题。
为了攻克这些难题,来自台湾大学公共卫生学院流行病学与预防医学研究所的梁雅婷(Ya-Ting Liang)和健康数据分析与统计研究所的 Charlotte Wang 等人开展了一项研究。该研究成果发表在《BioData Mining》杂志上。
研究人员提出了一种基于弹性距离的模式聚类算法,用于识别自由生活 PA 数据中的特定 PA 模式(motifs),并利用功能主成分分析(Functional Principal Component Analysis,FPCA)从每个模式中提取数字生物标志物,旨在推进个性化健康评估和疾病检测。
研究人员运用了多种关键技术方法。首先,采用弹性形状分析(Elastic Shape Analysis),通过平方根速度函数(Square Root Velocity Function,SRVF)框架对曲线进行配准,计算弹性距离,从而有效测量 PA 曲线之间的相似度,该距离同时考虑了相位和幅度的变化。接着,使用基于弹性距离的模式聚类算法,将长期 PA 曲线分割为较短的时间窗口,结合 K - 均值聚类算法对多轴 PA 数据进行聚类分析,并可根据先验知识对不同轴进行差异化加权。最后,利用 FPCA 对每个模式进行降维,提取有意义的特征作为数字生物标志物。研究数据来源于 2011 - 2012 年美国国家健康和营养检查调查(NHANES)、Depresjon 研究以及 PSYKOSE 研究。

研究结果

  1. NHANES 研究:通过弹性距离模式聚类方法分析儿童 PA 数据,发现 15 分钟的时间窗口最适合分析儿童活动模式,识别出每个轴有 6 个模式,共衍生出 18 个数字生物标志物。例如,Motif 6 可能代表睡眠或久坐行为,其约 45% 的相关曲线集中在夜间 00:00 - 05:59;Motif 4 可能代表时间独立的活动模式,在四个 6 小时时间间隔内频率相对稳定。
  2. Depresjon 和 PSYKOSE 研究:对于这两个数据集,30 分钟的时间窗口更适合捕捉患者活动模式。Depresjon 研究得到 6 个模式和 12 个数字生物标志物,PSYKOSE 研究得到 4 个模式和 8 个数字生物标志物。分析发现,对照组平均活动计数高于病例组,且健康个体昼夜节律更规律,患者则存在昼夜节律紊乱,夜间活动增加,白天活动减少。
  3. 关联研究:在 Depresjon 研究中,Motif 1、5、6 的 FPC 1 与抑郁症显著相关;在 PSYKOSE 研究中,Motif 1、2、4 的 FPC 1 和 Motif 4 的 FPC 2 与精神分裂症显著相关。
  4. 分类模型:在两个心理健康研究中,纳入数字生物标志物的分类模型性能优于仅使用人口统计信息的基线模型。例如,在 Depresjon 研究中,朴素贝叶斯模型的灵敏度提高了 0.35;在 PSYKOSE 研究中,朴素贝叶斯模型的灵敏度提高了 0.32,特异性也有所提高。

研究结论与讨论

该研究提出的基于弹性距离的模式聚类算法和 FPCA 方法,有效识别了自由生活 PA 数据中的模式,并提取了有意义的数字生物标志物。这些数字生物标志物能够更好地捕捉 PA 模式与健康结果之间的关联,为个性化健康评估和疾病检测提供了新的视角和有力工具。
不过,研究也存在一些局限性。如 k - 均值聚类算法对初始值敏感,虽可随机选择初始聚类中心或根据先验知识调整,但仍有改进空间;研究假设三轴数据相互独立,未来研究可探索考虑轴间相关性对结果的影响;时间窗口分割方法较为简单,采用更复杂的重叠段方法可能更准确地捕捉人类行为动态;数字生物标志物与实际活动的联系还需进一步研究。
尽管如此,该研究成果仍具有重要意义。它为 PA 数据分析提供了创新方法,推动了从传统统计量向更具信息性的数字生物标志物的转变,有望在未来医疗保健领域发挥重要作用,助力实现更精准的健康管理和疾病预防。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号