基于可穿戴设备数据的机器学习识别月经周期阶段:开启女性健康管理新篇章

【字体: 时间:2025年05月14日 来源:npj Women's Health

编辑推荐:

  为解决传统月经周期跟踪方法的局限,研究人员开展了利用可穿戴设备数据结合机器学习识别月经周期阶段的研究。结果显示随机森林(RF)模型在分类不同阶段时有较高准确率和 AUC-ROC 值。该研究为女性健康管理提供新途径。

  在女性健康领域,月经周期的准确跟踪和预测一直是备受关注的重要课题。月经周期作为女性生殖系统的基本生理过程,包含了卵巢和子宫内复杂的激素变化与结构转变。其中,卵泡刺激素(FSH)、黄体生成素(LH)、雌激素和孕激素等多种激素相互协作,共同调节着月经周期,该周期通常分为卵泡期(涵盖月经和排卵前阶段)和黄体期(排卵后阶段)。这些阶段和激素的波动对女性的生殖健康和生育能力至关重要。
然而,传统的月经周期跟踪方法存在诸多问题。以往主要依赖基础体温(BBT)来确认排卵,但 BBT 监测需要每天持续测量,且容易受外界因素影响,导致准确性欠佳。后来,虽有研究将 BBT 监测与尿 LH 检测集成在商业即时检测(POC)设备中,或使用如 OvuSense 等阴道温度传感器,一定程度上提高了准确性,但仍存在局限性。此外,像基于心电图(ECG)和心率变异性(HRV)特征的研究,样本量往往较小,难以全面反映不同人群的生理变化。因此,开发更精准、便捷的月经周期跟踪方法迫在眉睫。

为了解决这些问题,美国北佛罗里达大学(University of North Florida)的研究人员 Grentina Kilungeja、Krystal Graham、Xudong Liu 和 Mona Nasseri 开展了一项极具创新性的研究。他们旨在利用从腕带设备收集的多种生理信号,如皮肤温度、皮肤电活动(EDA)、心跳间期(IBI)和心率(HR),通过机器学习来识别月经周期阶段。该研究成果发表在《npj Women's Health》杂志上,为女性健康管理领域带来了新的曙光。

在研究过程中,研究人员运用了多种关键技术方法。首先是数据收集,使用 Empatica E4 和 EmbracePlus 腕带设备,从 22 名女性受试者收集了 75 个月经周期的数据。其中部分数据因受试者缺乏 LH 阳性检测结果或数据缺失而被排除,最终纳入分析的是 18 名受试者的 65 个排卵周期数据。同时,受试者需记录月经和 LH 阳性检测日,通过尿 LH 检测试纸确认排卵。其次是数据处理与特征提取,从原始生理数据中提取了涵盖时间、频率和时频等多领域的特征,包括均值、中位数、标准差等统计特征,以及针对 EDA 信号的特定特征。然后是特征选择与工程,基于生理相关性选择相关特征,并利用 Python 的 SelectKBest 函数进一步筛选,同时使用固定窗口和滚动窗口技术提取二次特征集。最后,研究人员训练并评估了决策树、随机森林、逻辑回归和支持向量机这四种机器学习模型,通过网格搜索交叉验证(GridSearchCV)和随机搜索进行超参数调优,使用留最后一周期法(leave-last-cycle-out)和留一受试者法(leave-one-subject-out)对数据进行分区,以评估模型性能。

下面来看具体的研究结果:

  • 固定窗口技术下模型性能:在预测四个阶段(月经(P)、卵泡(F)、排卵(O)、黄体(L))时,随机森林分类器表现最佳,准确率达 71%,ROC 曲线分析显示其整体曲线下面积(AUC)为 89%,在预测排卵阶段 AUC 得分最高。采用留一受试者法评估模型泛化能力时,逻辑回归表现较好,平均准确率为 63%。预测三个阶段(P、O、L)时,随机森林模型整体性能最高,准确率、精确率、召回率和 F1 得分均为 87%,AUC 得分为 96%。使用留一受试者法时,随机森林模型平均准确率仍达 87%。
  • 滚动窗口技术下模型性能:预测四个阶段时,随机森林分类器准确率为 68%。ROC 曲线显示所有模型在预测黄体期(L)时 AUC 得分较高,支持向量机模型整体 AUC 得分最高,为 80%。采用留一受试者法时,支持向量机、随机森林和逻辑回归模型表现相近,平均准确率约为 65%,决策树模型稍差,为 58%。预测三个阶段时,留最后一周期法下逻辑回归 AUC 得分最高,为 81%。采用留一受试者法时,逻辑回归平均准确率最高,为 61%,支持向量机为 60%。

研究结论和讨论部分指出,该研究表明利用可穿戴设备的多模态信号结合机器学习模型,能够在一定程度上准确识别月经周期阶段。其中,随机森林模型在固定窗口技术预测三个阶段和滚动窗口技术预测四个阶段时,均展现出较好的性能。这一研究成果为实时、个性化的健康监测提供了潜在的应用前景,有望将准确的阶段预测模型集成到可穿戴技术中,帮助女性更好地管理月经健康。

然而,研究也存在一定的局限性。样本量相对较小,仅 18 名排卵参与者和 65 个周期的数据,可能无法涵盖更广泛人群的生理变化,且未充分考虑参与者的种族、整体健康等人口统计学因素,这些因素可能影响模型性能。此外,腕带设备在数据收集过程中,可能因佩戴位置不一致、遵守研究协议的差异或环境因素影响信号质量,从而引入数据噪声,影响模型准确性。未来研究需要扩大样本量,纳入更多样化的人群,并增加验证步骤,以提高研究方法的稳健性和泛化能力。 总体而言,这项研究为女性月经周期跟踪研究开辟了新方向,尽管存在不足,但为后续研究奠定了重要基础,有望推动女性健康管理领域的进一步发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号