利用机器学习模型早期预测妊娠期糖尿病患者产后血脂异常:开拓孕期健康管理新路径

【字体: 时间:2025年03月08日 来源:Scientific Reports 3.8

编辑推荐:

  研究人员利用机器学习模型,分析孕期数据预测妊娠期糖尿病(GDM)患者产后血脂异常,XGBoost 模型表现优异,助力早期干预。

  妊娠期糖尿病(Gestational Diabetes Mellitus,GDM),这个在孕期悄然出现的 “健康杀手”,正威胁着无数母婴的健康。它不仅会增加孕妇患子痫前期、剖宫产、早产和巨大儿的风险,还会让母婴未来患心血管疾病的几率大大提高。而产后血脂异常,更是 GDM 患者产后健康的一大隐患,长期影响着妈妈们的身体。
目前,虽然有一些预测 GDM 患者产后血脂异常的模型,但大多存在方法学缺陷,缺乏时间验证,难以准确、稳定地预测风险。为了解决这一难题,来自惠州市第一妇幼保健院和惠州学院的研究人员展开了深入研究。他们的研究成果发表在《Scientific Reports》上,为 GDM 患者产后血脂异常的预测和干预带来了新的希望。

研究人员为了构建可靠的预测模型,采用了多种关键技术方法。他们收集了惠州市第一妇幼保健院 2021 年 10 月至 2023 年 12 月期间 15946 名单胎孕妇的临床数据作为样本队列。这些数据经过严格清洗、预处理后,被分为 Dataset A(n = 1116)用于模型训练和评估,Dataset B(n = 707)用于时间验证。研究人员运用支持向量机(SVM)、随机森林、决策树、Light Gradient Boosting Machine(LightGBM)和极端梯度提升(XGBoost)这 5 种机器学习算法来构建预测模型。同时,使用信息价值(IV)分析、模型重要性分析和 SHapley Additive exPlanations(SHAP)分析等方法评估特征的重要性。

下面来看具体的研究结果:

  • 参与者特征:Dataset A 包含 1116 个样本,其中 422 例(37.8%)出现产后血脂异常;Dataset B 包含 707 个样本,281 例(39.7%)出现产后血脂异常,这两个数据集的血脂异常患病率与之前研究相近1
  • 模型开发与评估:在 Dataset A 的独立测试集中,基于树的集成学习算法(XGBoost、LightGBM 和随机森林)表现出色,预测 GDM 患者产后血脂异常的准确率分别达到 70.54%、70.54% 和 69.64%,AUC-ROC 值分别为 0.7310、0.7194 和 0.7614,优于单一决策树和 SVM 模型。在 Dataset B 的时间验证中,XGBoost 模型表现最佳,准确率达 81.05% ,AUC-ROC 为 0.8792,且时间验证结果整体优于 Dataset A 测试集评估结果23
  • 特征重要性分析:通过相关性热图、IV 分析、XGBoost 特征重要性分析和 SHAP 分析发现,Feature2、总胆固醇、Feature3 与产后血脂异常相关性最强。IV 分析显示,这些特征的 IV 值超过 0.5,预测能力突出。SHAP 分析表明,总胆固醇在 XGBoost 模型中对预测结果的正向贡献最大45

研究结论与讨论部分意义重大。该研究构建的基于 XGBoost 算法的预测模型,经过严格的内部和时间验证,展现出优秀且稳定的预测性能。新设计的三个研究变量 Feature1、Feature2、Feature3,在预测早期妊娠血脂异常高风险人群方面有很强的正向贡献。借助这个模型和新变量,能够识别和分层高风险人群,以便及时采用限时进食等方法进行干预,改善妊娠结局,减少母婴短期和长期并发症。不过,该研究也存在局限性,如单中心、时间队列研究,未来还需多中心时间验证来进一步确认模型的可靠性。同时,研究人员计划引入深度学习技术,结合图像数据创建多模态模型,提升预测能力。

这项研究为 GDM 患者产后血脂异常的早期预测和干预提供了有力工具,为临床医生制定个性化的治疗方案提供了科学依据,有望推动孕期健康管理的发展,守护更多母婴的健康。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号