机器学习中心特异性模型在 IVF 活产预测上优于美国国家注册模型,为生育医疗带来新突破

《Nature Communications》:

【字体: 时间:2025年04月18日 来源:Nature Communications

编辑推荐:

  为解决 IVF 患者咨询和费用 - 成功率透明度问题,研究人员开展对比机器学习中心特异性(MLCS)模型和美国生殖医学协会(SART)模型预测 IVF 活产率的研究。结果显示 MLCS 模型在多项指标上表现更优,这有助于个性化预后咨询和提升费用 - 成功率透明度。

  不孕不育已被世界卫生组织认定为一种医学疾病和全球健康问题,据估计全球有超过 1 亿女性或夫妇受到影响,仅美国就有超 1000 万人。体外受精(In Vitro Fertilization,IVF)技术虽已证实安全有效,但患者接受 IVF 治疗却面临诸多阻碍。一方面,高昂的费用和不确定的活产结果让许多患者望而却步;另一方面,患者对 IVF 治疗的潜在益处和局限性缺乏清晰了解,这也影响了他们的决策。在这样的背景下,如何更精准地预测 IVF 活产率,为患者提供更可靠的预后咨询,成为了生殖医学领域亟待解决的问题。
为了攻克这些难题,来自美国多家机构的研究人员,包括 Univfy 公司研发部门、圣安东尼奥生育中心等,开展了一项极具意义的研究。他们聚焦于两种 IVF 活产预测模型:机器学习中心特异性(Machine Learning Center-Specific,MLCS)模型和美国生殖医学协会(Society for Assisted Reproductive Technology,SART)基于多中心和美国国家注册数据构建的模型。研究旨在比较这两种模型在预测 IVF 活产率方面的性能差异,进而为临床实践提供更科学的依据。最终研究成果发表在《Nature Communications》上。

在研究过程中,研究人员采用了多种关键技术方法。他们收集了 6 个中心 4635 名患者首次 IVF 周期的数据,这些数据来自各中心的电子病历和 SART 临床结果报告系统(SART CORS)。利用这些数据,研究人员运用 k 折交叉验证(k-fold cross validation)评估模型性能,通过计算受试者工作特征曲线下面积(Area Under the Curve of Receiver Operating Characteristic,ROC-AUC)、后验对数优势比(Posterior Log of Odds Ratio,PLORA)、Brier 分数等指标,对比分析 MLCS 模型和 SART 模型的预测能力 。

下面来看具体的研究结果:

  • 模型交叉验证和外部验证:研究中 6 个中心均参与创建了初始的 MLCS1 模型和更新后的 MLCS2 模型。通过交叉验证和外部验证(使用同期临床使用的时间外测试集进行验证,即 Live Model Validation,LMV),评估模型性能。结果显示,MLCS 模型在 ROC-AUC 指标上优于相应的年龄模型,表明其在区分能力上更具优势;同时,MLCS1 和 MLCS2 模型的 PLORA 值均为正,说明它们比年龄模型更能准确预测活产概率。此外,更新后的 MLCS2 模型虽在 ROC-AUC 上与 MLCS1 模型相似,但 PLORA 值显著提高,意味着模型更新提升了预测能力。
  • 外部验证或实时模型验证 MLCS1 模型:对 MLCS1 模型进行 LMV 验证,比较其内部交叉验证测试数据和 LMV 测试数据的 ROC-AUC 和 PLORA 值,结果显示两者无显著差异,这表明 MLCS1 模型在临床使用期间是适用的,不存在概念漂移问题。进一步对临床数据漂移的评估发现,虽然部分临床变量的统计分布存在差异,但这些差异并未影响 MLCS 模型的临床实用性。
  • 比较 MLCS2 和 SART 模型:使用修改后的中心特异性从头模型验证测试集 DNMV1 和 DNMV2 评估 MLCS2 和 SART 模型。结果显示,MLCS2 模型在 Brier 分数上表现更优,校准效果更好;在 F1 分数和 Precision-Recall(PR)AUC 指标上,MLCS2 模型也显著高于 SART 模型,表明其在预测活产结果、减少假阳性和假阴性方面表现更出色。通过创建 4×4 重新分类表发现,30% 的患者在 MLCS2 和 SART 模型中的活产预测存在差异,MLCS2 模型能更准确地将患者分类到合适的预后类别,例如将更多患者合理分配到 LBP≥50% 和 LBP≥75% 的类别中 。

研究结论和讨论部分指出,MLCS 模型在预测 IVF 活产率方面表现优于 SART 模型,这一结果对临床实践具有重要意义。在临床咨询中,更精准的预测模型可以为患者提供更透明、个性化的 IVF 预后咨询,帮助患者更好地了解治疗的潜在风险和收益,从而做出更明智的决策。同时,这也有助于实现基于价值的 IVF 定价,通过合理分层风险,减轻患者的经济负担,扩大 IVF 治疗的可及性。此外,MLCS 模型的应用还可以提高临床操作的效率,优化临床工作流程。

然而,该研究也存在一定局限性。研究仅涉及美国 6 个生育中心,样本量相对较小,且未证明模型设计差异与性能差异之间的因果关系。此外,研究未对不同机器学习技术进行比较,也未探讨深度学习等新兴技术在 IVF 活产预测中的应用。尽管如此,该研究为后续研究指明了方向,未来可在更多中心开展研究,进一步验证 MLCS 模型的性能,并探索如何更好地将其应用于临床实践,推动生殖医学的发展,帮助更多不孕不育患者实现生育梦想。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号