综述:人工智能方法在妊娠期糖尿病预测中的应用:系统性文献回顾

【字体: 时间:2025年11月03日 来源:International Journal of Medical Microbiology 3.6

编辑推荐:

  本综述系统回顾了人工智能(AI)与机器学习(ML)在妊娠期糖尿病(GDM)预测领域的最新进展。文章指出,尽管逻辑回归(LR)、支持向量机(SVM)等传统模型应用广泛,但多数研究存在高偏倚风险,且缺乏外部验证与临床可解释性。综述强调,未来研究需整合孕前数据与可穿戴设备信息,开发透明、可信的AI模型,以推动GDM的早期个性化干预。

  
引言:GDM的挑战与AI的机遇
妊娠期糖尿病(GDM)是妊娠期最常见的代谢性疾病,全球发病率约为14%,对母婴健康构成严重威胁。传统诊断通常在孕24-28周进行,错失了早期干预的黄金窗口。人工智能(AI)和机器学习(ML)技术为利用大规模、多模态数据实现GDM的早期预测带来了新的希望。本系统性综述旨在全面概述用于GDM预测的AI/ML方法,特别关注利用孕前和孕期数据的研究。
研究方法:系统性回顾与质量评估
本综述严格遵循PRISMA指南,检索了截至2024年5月27日的PubMed、Scopus、IEEE和Web of Science数据库。最终纳入78项符合标准的研究。研究质量采用PROBAST工具评估偏倚风险(ROB),并使用IJMEDI清单评估AI模型开发过程的质量。
结果概览:主流方法与数据利用
  • 常用AI方法:逻辑回归(LR,46项研究)、树型模型(如随机森林RF,41项研究)和支持向量机(SVM,29项研究)是最常用的AI方法。然而,在报告性能最佳的模型中,神经网络(15项研究)和 boosting 方法(如XGBoost,14项研究)表现突出。
  • 关键预测因子:最常用的预测因子包括体重指数(BMI,50项研究)、年龄(48项研究)和糖尿病家族史(FHDM,19项研究)。血糖相关参数,如空腹血糖(FPG)、糖化血红蛋白(HbA1c)和口服葡萄糖耐量试验(OGTT)也被广泛使用。
  • 孕前数据利用不足:仅有12项研究尝试利用孕前数据(如遗传信息、孕前实验室数据)进行预测,这表明该领域存在巨大探索空间。
  • 可穿戴设备数据潜力:仅有两项小规模研究使用了连续血糖监测(CGM)等可穿戴设备数据,其潜力远未被充分发掘。
  • 模型验证与性能报告:绝大多数研究(73项)仅进行了内部验证。仅有13项研究进行了外部验证,3项进行了独立验证,这严重限制了模型的泛化能力和临床转化前景。性能指标报告不完整,例如,54项研究报告了曲线下面积(AUC),但只有40项和26项分别报告了敏感性(Sen)和特异性(Spe)。校准和临床决策曲线分析等关键指标则极少被报告。
质量评估:高偏倚风险与报告缺陷
PROBAST评估显示,94%的研究存在高偏倚风险,主要源于分析领域的缺陷,如缺失数据处理不当、预测因子筛选不透明、模型校准缺失等。IJMEDI清单评估的平均得分为25.1分(满分50分),表明大多数研究在数据准备、模型验证和部署准备方面存在不足。
讨论与未来方向
当前GDM预测的AI研究似乎陷入了一个“舒适区”,过度依赖少数几种传统模型。未来的突破点可能在于:
  1. 1.
    数据创新:整合孕前健康档案、可穿戴设备产生的连续生理数据(如CGM、体力活动),构建纵向、多模态数据集。
  2. 2.
    方法学进阶:超越预测,发展可解释AI(XAI)和因果模型,以理解GDM发生发展的内在机制,而不仅仅是关联关系。
  3. 3.
    临床转化驱动:加强跨学科合作,确保模型开发之初就考虑到临床工作流程的需求。严格遵循TRIPOD+AI等报告规范,进行广泛的外部验证和成本效益分析,是迈向临床应用的必由之路。
结论
AI驱动的GDM预测研究正在迅速发展,展现出实现更早、更个性化干预的强大潜力。然而,当前大多数模型的方法学严谨性和报告透明度不足,阻碍了其向临床实践的转化。未来的工作应优先考虑透明报告、外部验证,并利用多样化纵向数据开发值得信赖、可解释的模型。数据科学家、临床医生和医疗系统之间更紧密的合作,对于实现从AI创新到临床实践的闭环至关重要。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号