
-
生物通官微
陪你抓住生命科技
跳动的脉搏
机器学习模型预测孕妇自发性早产风险:基于甲状腺功能与血液指标的多因素分析
【字体: 大 中 小 】 时间:2025年07月14日 来源:Archives of Gynecology and Obstetrics 2.1
编辑推荐:
本研究针对自发性早产(sPTB)这一全球健康难题,开发了基于CatBoost算法的预测模型。研究人员通过回顾性分析1122名孕妇的临床数据,结合六种变量筛选方法,发现游离三碘甲状腺原氨酸(FT3)、白蛋白/球蛋白比值(A/G)等五项核心指标对sPTB预测最具价值,模型AUC达0.8762。该研究为临床早期识别高风险孕妇提供了无创、便捷的新工具,同时揭示甲状腺功能异常与sPTB的潜在关联,对优化产前管理策略具有重要意义。
早产是全球新生儿死亡的首要原因,其中自发性早产(sPTB)占比高达70%。现有预测方法如宫颈长度测量存在侵入性缺陷,胎儿纤连蛋白检测效果存疑,临床亟需更精准、便捷的预测工具。西北妇女儿童医院超声诊断中心联合多家机构的研究团队在《Archives of Gynecology and Obstetrics》发表创新成果,通过机器学习技术挖掘常规产检数据中的预测价值。
研究团队采用回溯性队列设计,从医院信息系统(HIS)提取1122名孕妇(187例sPTB vs 935例足月产)的62项临床指标。运用随机森林填补缺失值后,通过六种变量筛选方法(包括向后消除法、LASSO回归等)结合八种机器学习算法(如CatBoost、XGBoost)构建预测模型。最终CatBoost+向后消除法的组合表现最优,其AUROC达0.8762,AUPRC为0.7061,Brier评分0.12显示优秀校准度。
关键发现
模型性能:最佳模型在测试集灵敏度31%、特异度95%,阳性预测值达95%时阴性预测值为87%,决策曲线分析显示临床净获益区间覆盖3-98%风险阈值。
核心预测因子:SHAP分析揭示FT3(游离三碘甲状腺原氨酸)贡献度最高,低水平与高风险显著相关;A/G(白蛋白/球蛋白)比值降低、TgAb(甲状腺球蛋白抗体)升高、总甲状腺素(TT4)异常及RDW(红细胞分布宽度)变化构成前五大预测指标。
生物学机制:研究证实甲状腺功能紊乱(低FT3、高TgAb)与sPTB的强关联,支持感染/炎症通路假说;同时发现WBC(白细胞)和中性粒细胞升高反映的亚临床感染状态也是独立风险因素。
临床意义
该模型首次整合甲状腺功能与常规血液指标,仅需孕20-28周的单次检测即可预测风险,较传统方法更易实施。个体化SHAP分析功能可直观展示每位孕妇的特异风险因素,如某案例中FT3低于4.56 pmol/L时SHAP值增加0.15风险分。但研究者指出,部分关键指标(如TgAb)并非全球产检常规项目,需通过多中心研究验证普适性。
这项研究为sPTB预测提供了创新方法论,其揭示的甲状腺-免疫交互机制为后续病因学研究指明方向。未来可通过前瞻性研究纳入宫颈长度等参数进一步提升模型性能,最终实现从"被动治疗"到"精准预防"的产前管理范式转变。
生物通微信公众号
知名企业招聘