机器学习联合 SHAP 分析:精准预测顺产产后出血的新利器

【字体: 时间:2025年05月04日 来源:BMC Pregnancy and Childbirth 2.8

编辑推荐:

  产后出血(PPH)严重威胁产妇健康,传统评估工具效能低。研究人员开展用机器学习(ML)结合 SHAP 分析预测顺产 PPH 的研究。结果显示构建的 XGBoost 模型预测精准度高。这为 PPH 个性化风险评估和预防提供了有力工具。

  在妇产科领域,产后出血(Postpartum Hemorrhage,PPH)一直是困扰医生和威胁产妇生命健康的一大难题。PPH 是全球范围内的重要健康问题,尤其在资源匮乏地区,它是导致孕产妇死亡的主要原因之一 。在常规临床实践中,医生通常依靠评估临床病史、进行身体检查和实验室测试来估计 PPH 的发生概率,但这些传统的出血评估工具存在局限性,敏感性和特异性有限,且 PPH 发病率较低,使得评估效果不佳。随着医疗大数据和人工智能的发展,PPH 的预测模型开始出现,但现有研究大多未区分剖宫产和顺产导致的 PPH,并且在模型构建中,预测因素的选择常受数据收集和样本量的限制,缺乏全面评估。此外,机器学习(Machine Learning,ML)在医学领域虽有优势,但面临数据缺失、模型过拟合、算法结构复杂难以解释等挑战。在这样的背景下,开展一项能够更精准预测顺产 PPH 的研究迫在眉睫。
中国医科大学附属盛京医院等研究机构的研究人员针对上述问题展开研究。他们的研究成果发表在《BMC Pregnancy and Childbirth》上,为 PPH 的预测和防治带来了新的希望。

研究人员开展了一项回顾性多中心队列研究。研究对象为 2018 年 9 月至 2023 年 12 月在东北三家三级医院顺产的女性。数据来源于医院电子病历系统,涵盖产妇基本特征、产科病史、妊娠并发症、分娩过程和新生儿状况等多个方面。为防止过拟合,数据集被分为训练集(70%)和内部验证集(30%),并使用单独数据集进行外部验证 。研究中运用了多种关键技术方法:首先是数据处理技术,采用中位数插补处理缺失数据,对相关性较高(相关系数 > 0.6)的特征进行筛选 ;其次运用多种 ML 算法构建预测模型,包括极端梯度提升(XGBoost)、轻量梯度提升机(Light Gradient Boosting Machine,LGBM)等六种模型 ;最后利用 SHapley Additive exPlanations(SHAP)方法进行特征选择和模型解释。

研究结果如下:

  • 模型性能比较:在构建的六个 ML 模型中,XGBoost 模型对 PPH 的预测准确性最高,训练集的曲线下面积(Area Under Curve,AUC)达到 0.997。这表明该模型在区分发生 PPH 和未发生 PPH 的产妇方面具有出色的能力。
  • 特征选择与模型确定:通过 SHAP 值分析进行特征选择,确定了 15 个对模型预测能力有重要贡献的关键特征。在特征减少过程中,当特征数量减少到 15 个时,XGBoost 模型仍保持良好的预测能力,AUC 和 F1 评分无显著变化,因此最终选定包含 15 个特征的 XGBoost 模型 。
  • 模型解释:利用 SHAP 的全局解释和局部解释,分析了 15 个特征对模型预测的贡献。例如,新生儿体重≥3500g 或第二产程≥100min 的产妇,SHAP 值大于零,增加了 PPH 的预测风险 。这为医生理解模型决策过程提供了依据。
  • 模型验证:对最终模型进行内部和外部验证,内部验证集的 AUC 为 0.894,外部验证集的 AUC 为 0.880,表明模型在不同数据集上都具有较强的预测性能 。同时,校准曲线和决策曲线分析(Decision Curve Analysis,DCA)也显示模型在内部和外部验证数据集中表现良好。
  • 临床应用:研究人员将最终的预测模型部署到网络应用程序中,医生输入 15 个特征的实际值,就能预测个体产妇发生 PPH 的风险,并通过力图展示各特征对预测结果的影响 。这大大提高了模型的临床实用性。

研究结论表明,该研究成功开发了一种可解释的 ML 模型,能够利用医院信息系统(Hospital Information System,HIS)中的临床数据,准确预测顺产患者的 PPH 风险。这一模型为临床实践中的早期风险评估和干预提供了有前景的工具。不过,研究也存在一些局限性,如数据仅来自沈阳地区,可能存在选择偏倚,影响模型的普适性;严格的纳入标准可能影响 PPH 预测的客观性;且 ML 技术构建模型所需的样本量尚无标准,结论解释需谨慎。但总体而言,这项研究在 PPH 预测领域迈出了重要一步,为后续研究和临床实践提供了宝贵的参考,有望推动个性化医疗在妇产科领域的发展,降低产妇因 PPH 导致的发病率和死亡率。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号