编辑推荐:
为解决 ERCP 治疗胆总管结石患者缺乏有效 PEP 预测模型的问题,研究人员纳入 2247 例患者,用 6 种机器学习算法开发模型。RF 算法表现最佳,外部验证 AUC 均值 0.768,还开发了 Web 工具,为临床评估风险提供新途径。
内镜逆行胰胆管造影(ERCP)是胆总管结石(CBDS)的重要治疗手段,但其术后胰腺炎(PEP)并发症一直困扰着临床医生。PEP 发生率在普通人群中为 2-9%,而高危人群可超 25%,严重影响患者预后。目前,针对 ERCP 术后完全取石患者的 PEP 预测模型匮乏,且传统统计方法难以捕捉复杂风险因素间的非线性关系。在此背景下,中国科学技术大学第一附属医院联合多家国内中心的研究团队,开展了一项基于机器学习的 PEP 风险预测研究,相关成果发表于《iScience》。
该研究采用回顾性队列设计,内部数据集来源于 2015 年 1 月至 2023 年 1 月中国科学技术大学第一附属医院 2247 例接受 ERCP 且成功取石的患者,外部验证则纳入 12 个国内中心的 674 例患者数据。研究主要运用 6 种机器学习算法(随机森林 RF、极端梯度提升 XGBOOST、支持向量机 SVM 等),结合 25 项临床参数(包括人口学特征、病史、实验室指标及操作相关因素)构建预测模型,并通过分层抽样、5 折交叉验证及外部多中心数据验证模型效能。
研究结果
1. 患者基线特征与风险因素分析
PEP 发生率为 3.38%(76/2247),女性占比 69.74%,平均年龄 54.47±13.26 岁,显著低于非 PEP 组(60.07±16.01 岁,p=0.003)。单因素分析显示,胰腺炎病史、女性、胆总管直径较小(9.21±2.72 mm vs. 10.92±4.44 mm,p=0.001)、插管困难(25.00% vs. 6.86%,p<0.001)等是 PEP 高危因素。多因素 Logistic 回归确定插管困难(OR=3.990)、胰腺炎病史(OR=3.810)、胆总管直径(OR=0.918)及女性(OR=2.179)为独立风险因素。
2. 机器学习模型效能对比
在内部测试集中,RF 算法表现最优,受试者工作特征曲线下面积(AUC)达 0.947(95% CI=0.927-0.963),显著高于其他算法(如 XGBOOST 的 0.905、SVM 的 0.695)。外部验证中,RF 模型在 12 个中心的 AUC 范围为 0.576-0.913,平均 0.768,显示出较好的泛化能力。
3. 模型可视化与临床工具开发
研究结论与讨论
本研究首次开发并外部验证了针对 ERCP 术后胆总管结石完全清除患者的 PEP 预测模型,RF 算法因其高准确性和鲁棒性成为最优选择。研究明确了插管困难、胰腺炎病史、胆总管直径及性别等关键风险因素,并通过可视化工具提升了模型的临床可解释性。所开发的 Web 应用为全球临床医生提供了免费、便捷的风险评估工具,有助于实现 PEP 高危患者的个体化管理,例如术前干预或术后密切监测。
尽管研究存在未纳入操作时长、器械选择及内镜医师经验等局限,但多中心数据验证增强了模型的可信度。该研究不仅填补了 ERCP 术后 PEP 预测领域的空白,也为机器学习在消化内镜并发症预测中的应用提供了范例,有望推动精准医疗在肝胆胰疾病诊疗中的发展。未来需进一步通过前瞻性研究验证模型,并整合更多实时操作数据以优化预测效能。