机器学习增强中孕期唐氏筛查生物标志物可显著提升小于胎龄儿预测效能

【字体: 时间:2025年10月02日 来源:Orphanet Journal of Rare Diseases 3.5

编辑推荐:

  本研究针对中孕期常规血清筛查指标(AFP、fβ-hCG、uE3)对不良胎儿生长结局(AFGO)预测效能不足的问题,开发了机器学习增强预测模型。研究发现uE3对AFGO预测性能最优(SGA预测AUC=0.626),GBM和GLM模型显著提升SGA预测准确率(测试集AUC分别达0.717和0.739),为整合常规产前筛查与机器学习技术早期识别AFGO提供了新策略。

  
在围产医学领域,准确预测胎儿生长异常一直是个重大挑战。小于胎龄儿(SGA)和大于胎龄儿(LGA)不仅直接影响新生儿健康,还与远期代谢综合征(如胰岛素抵抗、肥胖和心血管疾病)风险密切相关。目前临床主要依赖超声生物测量和母体并发症评估,这些方法在早期识别方面敏感性有限。令人惊喜的是,常规中孕期唐氏筛查所采集的母体血清生物标志物——甲胎蛋白(AFP)、游离β-人绒毛膜促性腺激素(fβ-hCG)和非结合雌三醇(uE3),除了用于胎儿非整倍体和神经管缺陷筛查外,还可能反映胎盘功能障碍和胎儿生长受损。然而,这些标志物在预测不良胎儿生长结局(AFGO)方面的系统应用尚未充分开发。
在此背景下,Zhang等人发表在《Orphanet Journal of Rare Diseases》的研究探索了如何利用这些常规筛查指标,结合机器学习技术提升AFGO预测能力。研究人员发现,单纯依靠传统生物标志物预测效果有限,而机器学习算法的引入可能改变这一现状。
研究团队采用了几项关键技术方法:回顾性收集了2533名单胎妊娠健康女性的临床数据(来自常州市妇幼保健院2015-2016年队列);使用时间分辨荧光免疫分析法定量血清生物标志物;采用多重逻辑回归模型分析生物标志物与AFGO的关联;开发并比较了四种机器学习模型(梯度提升机GBM、广义线性模型GLM、随机森林RF和深度学习DL)的预测性能。
研究结果通过多个维度展开:
研究人群特征显示,在2533例单胎活产中,8.33%被分类为SGA,14.73%为LGA。uE3水平呈现一致规律:从SGA到LGA随胎儿生长状况改善而逐步升高,组间差异显著(P<0.001)。
母体血清分析物与胎儿生长的关系分析表明,uE3 MoM每增加一个标准差,与出生身长(β=0.11 cm)和体重(β=63.79 g)增加显著相关;而AFP MoM增加则与出生身长(β=-0.06 cm)和体重减少相关。
母体血清分析物与AFGO的关联分析揭示,uE3与SGA(OR=0.51)和低出生体重(LBW)(OR=0.31)呈强负相关,与LGA(OR=1.22)和巨大儿(Mac)(OR=1.22)呈正相关。平滑曲线拟合分析显示了血清分析物与AFGO之间的非线性关系。
用血清分析物及相关模型预测AFGO的结果表明,uE3预测AFGO的能力优于fβ-hCG或AFP单独使用(SGA的AUC:0.626 vs. 0.501/0.500)。机器学习模型中,GBM和GLM在训练集(n=1782)中对SGA预测表现出最优性能,AUC值分别为0.873和0.706;在测试集(n=751)中AUC分别为0.717和0.739。
研究结论与讨论部分强调,胎盘是母体血清三重筛查分析物的主要调节器官,直接分泌fβ-hCG和uE3,并精确调节AFP的胎盘转运。病理条件下这些基本胎盘功能破坏可能导致生物标志物特征性改变和随后的胎儿生长轨迹受损。本研究首次提供临床证据表明uE3在SGA检测中表现出优异的预测能力(AUC=0.63),而GBM和GLM模型在内部验证中显示出更高的预测准确性。
这些计算工具扩展了产前三重标志物筛查的临床应用范围,尽管其转化价值需要在多民族人群中进行外部验证以确保普遍适用性。在实际应用中,提出的模型可以无缝集成到现有的产前护理工作流程中,作为常规中期非整倍体筛查后的二次筛查工具。使用已有的生物标志物数据和母亲人口统计特征,算法可以在妊娠中期自动生成个体化的SGA风险评分。被归类为高风险孕妇可以接受强化监测,包括系列生长超声、多普勒研究和多学科咨询。这种分层方法通过优先对高风险妊娠进行专门监测,同时减少低风险人群的不必要干预,从而优化资源分配。
此外,识别非典型生物标志物模式可能促进对潜在罕见遗传或胎盘疾病的早期调查,从而实现及时的分子检测和个性化管理策略。除了直接的产科应用,这种方法对某些罕见疾病检测可能具有变革性潜力。例如,早期识别与先天性甲状腺功能减退症、Beckwith-Wiedemann综合征、Edwards综合征或Angelman综合征等疾病相关的SGA模式,都可以促进及时的遗传评估和个性化管理。
研究的优势包括采用严格的统计方法(调整多种混杂因素),全面评估胎儿生长结局,以及使用机器学习算法进行预测建模。局限性包括观察性设计无法确定因果关系,人群代表性有限(仅限于中国单一诊所的低风险妊娠),以及残留混杂可能性。当前SGA预测模型(GBM AUC=0.72;GLM AUC=0.74)低于临床可操作阈值(AUC≥0.75),但通过系统整合两个关键因素:(1)详细的临床病史,特别是先前的不良妊娠结局,如FGR或PE;(2)扩展的生物标志物组,这种组合方法有望将预测准确性提高到超过0.75 AUC基准,最终改善临床决策的产前风险分层。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号