基于机器学习和可解释人工智能的早中期妊娠标志物预测新生儿出生体重研究

【字体: 时间:2025年07月20日 来源:Scientific Reports 3.8

编辑推荐:

  为解决低出生体重(LBW)这一全球性健康挑战,印度Manipal高等教育学院的研究团队开展了一项前瞻性研究,通过整合19项临床特征和三种可解释人工智能(XAI)技术,开发了准确率达77%的AdaBoost预测模型。研究发现母体身高、颈项透明层厚度(NT)、糖化血红蛋白(HbA1c)等是关键预测因子,为临床早期干预提供了量化工具。

  

低出生体重(LBW)是威胁全球新生儿健康的重大挑战,每7个新生儿中就有1个体重不足2500克。这些婴儿不仅面临呼吸窘迫、败血症等短期并发症,更可能产生神经发育迟缓、2型糖尿病等长期健康风险。传统超声生物测量虽能评估胎儿体重,但缺乏早期预测能力,且机器学习模型的"黑箱"特性阻碍了临床信任。

印度曼尼帕尔高等教育学院(Manipal Academy of Higher Education)妇产科团队联合计算机专家,在《Scientific Reports》发表创新研究。该团队前瞻性收集237例单胎妊娠妇女的19项临床数据,包括母体人体测量参数(身高、BMI)、首孕程标志物(冠臀长CRL、NT厚度)、中孕程超声参数(双顶径BPD、股骨长FL)及风险因素(GDM、HTN)。研究采用SMOTE处理数据不平衡问题,对比8种机器学习算法,并首次结合SHAP、LIME和Anchor三种XAI技术提升模型可解释性。

关键技术包括:1) 采用十折交叉验证优化模型;2) 开发自定义堆叠集成架构;3) 通过互信息曲线筛选特征;4) 应用Welch's ANOVA和多元逻辑回归进行统计学验证。研究特别关注多分类问题,将出生体重划分为正常体重(NBW>2500g)、低体重(LBW<2500g)和极低体重(VLBW<1500g)。

主要结果

  1. 模型性能:AdaBoost表现最优,准确率达77%,F1分数72%。堆叠模型准确率75%,对NBW预测效果最佳,但VLBW预测受样本量限制。

  2. 关键预测因子:SHAP分析显示母体身高(每增加1cm关联体重增加7.08g)、NT厚度(>3mm风险增加)、产次(初产妇OR值7.59)最具影响力。LIME进一步验证CRL和TSH的贡献。

  3. 临床关联:锚定规则发现身高≤148.56cm联合头围(HC)≤172mm预测LBW的精度达77%,而BMI≤24.20kg/m2与VLBW显著相关(p=0.015)。

  4. 生物学机制:研究证实PAPP-A(妊娠相关血浆蛋白A)水平与胎盘功能相关,HbA1c>5.21%提示血糖控制不良导致 macrosomia 风险,与既往研究一致。

讨论与意义
该研究首次证明早孕期临床指标(如11-13周NT)对出生体重的预测价值,突破传统中晚孕评估的局限。通过XAI技术,模型不仅显示"哪些因素重要",更揭示"如何重要"——如初产妇通过子宫胎盘循环改变影响胎儿营养供给。尽管样本量和种族单一性限制泛化能力,但模型采用的参数均为常规产检项目,在资源有限地区具推广价值。

这项研究为实施WHO"倒金字塔理论"提供技术支撑:通过早期识别高风险胎儿,可针对性加强营养干预或阿司匹林预防治疗。未来整合基因组学和多中心数据,有望建立更精准的胎儿医学预测体系。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号