机器学习助力妊娠期糖尿病早期检测:开辟精准医疗新路径

【字体: 时间:2025年03月14日 来源:BMC Medical Informatics and Decision Making 3.3

编辑推荐:

  为解决妊娠期糖尿病(GDM)早期检测问题,研究人员开展相关研究,模型预测准确率达 88.8%,意义重大。

  在孕育新生命的旅程中,妊娠期糖尿病(Gestational Diabetes Mellitus,GDM)却如同一颗 “暗雷”,威胁着母婴健康。GDM 是指在妊娠期间首次出现的任何形式的高血糖,全球有超 14% 的孕妇受其困扰,在卡塔尔,这一比例更是高达 23.5%。它不仅会引发孕妇早产、剖宫产率增加等问题,还让宝宝未来患代谢性疾病的风险大大提高,对妈妈们而言,发展成 2 型糖尿病(T2D)的几率也显著上升。目前,GDM 常于妊娠 24 - 28 周通过口服葡萄糖耐量试验(OGTT)诊断,这意味着可能错过早期干预的黄金时机,因此,找到一种能早期检测 GDM 的方法迫在眉睫。
在此背景下,来自卡塔尔哈马德?本?哈利法大学(Hamad Bin Khalifa University)等机构的研究人员开展了一项极具意义的研究,相关成果发表于《BMC Medical Informatics and Decision Making》。

研究人员采用了一系列关键技术方法。首先,他们从卡塔尔生物样本库(Qatar Biobank,QBB)中收集了 138 名女性患者孕早期(妊娠 12 周前)的数据,其中 63 人在孕中期被诊断为 GDM,75 人为非 GDM 患者。接着,对数据进行清洗和预处理,通过中位数插补法处理缺失值,再利用 “StandardScaler” 将特征归一化,使所有变量具有一致的尺度。之后,运用互信息(Mutual Information,MI)和 F1 分数法进行特征选择,挑选出最具预测能力的特征。最后,构建多种机器学习(Machine Learning,ML)模型,包括随机森林分类器、梯度提升分类器等,并将 11 种模型组合成集成模型,以逻辑回归分类器作为元模型。

研究结果如下:

  • 特征筛选与相关性:通过两步筛选法,确定了 26 个对 GDM 检测贡献最大的生物标志物,如高血糖或糖尿病病史、HbA1C%、甘油三酯等。这些特征之间存在一定相关性,共同影响着模型对 GDM 的预测。
  • 模型性能评估:以这 26 个特征训练模型,集成模型表现最佳,平均准确率达到 88.8%。同时,模型在敏感度(92.1%)、特异性(84.94%)、精度(87.34%)和 F1 分数(89.56%)等指标上也表现出色,表明模型能有效识别 GDM 患者,且误判率较低。
  • 临床生物标志物分析:研究发现 HOMA-IR(22.5 Scale)对模型预测影响最大,其次是胰岛素和糖尿病或高血糖病史。此外,尿酸、胆固醇等也被确定为潜在的临床生物标志物。
  • 潜在混杂因素影响:研究纳入了母亲年龄、饮食习惯和生活方式等潜在混杂变量。结果显示,这些因素会影响模型性能,不同亚组的 AUC 存在差异。例如,年轻组(≤30 岁)AUC 为 92.1%,老年组(>30 岁)为 91.2%;高体力活动组 AUC 达 95.6%,低体力活动组为 89.7% 。

在结论与讨论部分,该研究首次利用孕早期临床数据和机器学习技术对卡塔尔人群的 GDM 进行早期预测,为临床诊断提供了新的思路。模型识别出的生物标志物有助于深入了解 GDM 的发病机制,其中 HOMA-IR 与糖尿病病史、胰岛素水平密切相关,进一步证实了其在 GDM 发生中的关键作用。不过,研究也存在一定局限性,如数据集相对较小,模型依赖血液样本检测,成本较高且耗时,在资源有限的医疗环境中应用可能受限。未来,需要在更大的队列中验证模型的准确性,探索更便捷、经济的检测方法,以推动 GDM 早期检测技术的广泛应用,更好地保障母婴健康。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号