《International Journal of General Medicine》:Novel Clinically Validated Machine Learning Model for Early Pregnancy Loss in Recurrent Spontaneous Abortion: Integrating Serum Autoantibodies and Ultrasonic Parameters
编辑推荐:
本综述建立并验证了整合血清自身抗体(aβ2-GP1、TgAb、AsAb、ACA)与超声子宫内膜容受性参数(RI、内膜厚度、内膜体积、VI、VFI)的机器学习模型(Logistic回归最优,AUC=0.94),可精准预测复发性流产(RSA)患者再次妊娠的早期流产风险。该模型通过列线图实现可视化风险分层,为临床个体化干预提供新策略。
研究背景与意义
复发性流产(RSA)指连续发生≥2次妊娠丢失,全球发病率达1%-5%,其中超过40%患者病因不明(不明原因RSA,URA)。患者再次妊娠时流产风险高达33%,且常伴焦虑抑郁等心理问题。现有预测模型(如Lund模型、Kolte & Westergaard模型)因变量不全、验证不足而受限。近年来,机器学习(ML)技术在精准医疗中展现优势,而免疫因素(如自身抗体)与子宫内膜容受性参数被证实与妊娠结局密切相关。本研究旨在整合血清自身抗体与超声参数,构建可临床应用的早期流产预测模型。
研究方法与对象
回顾性纳入2019年1月至2024年12月西安市人民医院(西安市第四医院)生殖医学科收治的RSA患者,均符合≥2次自然流产史、当前孕6-12周、宫内单胎妊娠标准。排除合并子宫病变、血流动力学疾病者。最终589例患者按7:3随机分为训练集(n=412)与验证集(n=177)。收集基线资料、血清自身抗体(aβ2-GP1、TgAb、AsAb、ACA)及超声参数(阻力指数RI、内膜厚度、内膜体积、血管化指数VI、血流指数VFI)。通过单因素/多因素Logistic回归、LASSO回归、SHAP值分析筛选变量,并比较逻辑回归(LR)、随机森林(RF)、XGBoost等7种机器学习模型性能。
关键结果发现
- 1.
预测因子筛选:多因素分析确定8个核心预测变量,包括aβ2-GP1阳性、TgAb阳性、AsAb阳性、RI升高,以及内膜厚度、内膜体积、VI、VFI降低(均P<0.001)。
- 2.
模型性能对比:LR模型表现最优,训练集AUC=0.94、准确率=0.93;验证集AUC=0.92、准确率=0.90,显著优于其他模型(如XGBoost AUC=0.88)。决策曲线(DCA)与校准曲线均显示LR模型具良好临床适用性与预测一致性。
- 3.
临床工具开发:基于LR模型构建在线列线图(图5A),整合8变量实现个体化风险评分。校准曲线(图5B、5C)显示预测概率与实际结局高度吻合。
机制与临床关联性分析
- •
自身抗体作用:aβ2-GP1通过促血栓形成及滋养细胞损伤导致流产;TgAb可能扰乱下丘脑-垂体-卵巢轴(HPO轴)平衡及免疫微环境(如升高IFN-γ、IL-17A);AsAb则干扰精子与透明带(ZP)结合,影响胚胎着床。
- •
超声参数意义:内膜厚度、体积及VFI降低反映子宫内膜容受性下降;RI升高提示子宫动脉血流阻力增加,导致胎盘灌注不足,与既往研究一致(如孕8-10周RI升高者流产风险显著增加)。
研究局限与展望
本研究为单中心回顾性设计,样本同质性强,未纳入男性因素、生活方式及动态生化指标(如β-hCG变化)。未来需通过多中心前瞻性研究扩大样本,引入更多变量以优化模型普适性。
结论
本研究成功建立基于自身抗体与超声参数的LR预测模型,为RSA患者早期流产风险分层提供精准工具,有望指导临床个体化干预,改善妊娠结局。