编辑推荐:
在临床中,区分复杂性阑尾炎(CAP)和非复杂性阑尾炎(UAP)颇具挑战。温州医科大学研究人员收集 773 例阑尾切除术患者数据,构建 XGBoost 模型。结果显示该模型预测性能最佳,有助于优化临床决策。
阑尾炎,这个听起来并不陌生的疾病,却在临床上给医生们带来了不少难题。急性阑尾炎是全球常见的急性腹部外科疾病,美国人群中患阑尾炎的终生风险约为 9%,其中复杂性阑尾炎的患病率达 16 - 40%。对于非复杂性阑尾炎,保守的抗生素治疗既安全又有效;而复杂性阑尾炎患者大多需要紧急进行阑尾切除术,若手术延迟,还会引发更多并发症。并且,非复杂性阑尾炎的死亡率约为 0.1%,但由穿孔或坏疽性阑尾炎导致的复杂性阑尾炎,死亡风险可高达 5 - 6%。因此,及时区分这两种疾病至关重要。
目前,阑尾炎的术前诊断主要依靠病史、体格检查、实验室检查和影像学检查。这些方法虽能使 90% 以上的急性阑尾炎患者得到早期准确诊断,但在区分复杂性和非复杂性阑尾炎时却困难重重。像 AIRS 和 Alvarado 评分系统,虽使用简便,却主观性强,难以有效区分二者;基于 CT 的评分系统,虽能将敏感度和特异度提高到约 80%,却会增加患者的辐射暴露和经济负担,诊断结果也有待提升。近年来,机器学习技术在临床医学领域广泛应用,一些研究尝试用其预测复杂性阑尾炎,但现有模型过于依赖影像学,性能仍有提升空间。
在这样的背景下,温州医科大学的研究人员开展了一项极具意义的研究。他们旨在构建一个安全、经济的诊断模型,以准确快速地区分复杂性和非复杂性阑尾炎。研究成果发表在《BMC Gastroenterology》杂志上。
为开展此项研究,研究人员采用了多种关键技术方法。首先,他们回顾性收集了 2020 年 1 月 1 日至 2023 年 12 月 30 日在温州中心医院接受阑尾切除术患者的数据。利用随机森林算法进行特征选择,筛选出重要特征。之后,将数据按 3:1 的比例分为训练集和测试集,使用 R 软件构建 XGBoost 模型,并与支持向量机(SVM)、随机森林(RF)、决策树(CART)算法构建的模型进行比较。通过计算受试者工作特征曲线下面积(AUC)、敏感度、特异度、准确度等多种指标评估模型性能,还运用 SHAP(SHapley’s method of additive interpretation)方法解释模型。
下面来看看具体的研究结果。
- 参与者基线特征:研究共纳入 773 例患者,其中 357 例被诊断为复杂性阑尾炎(46.2%)。对比发现,CAP 组患者的年龄、体温、心率、嗜酸性粒细胞百分比、血小板、C 反应蛋白(CRP)、血糖和尿素氮等指标显著高于 UAP 组;而收缩压、单核细胞百分比、红细胞百分比和总胆红素则显著低于 UAP 组。此外,CAP 组中 89% 的患者疼痛至手术时间超过 24 小时(WTOG24 h)1。
- 变量筛选结果和数据集分布:以阑尾炎类型为结果变量,有 31 个预测变量。经特征选择,最终选取前 15 个变量用于后续模型构建,包括 CRP、WTOG24 h、腹肌紧张度、心率等。随后,患者被分为训练集(n = 580)和测试集(n = 193),且两组样本特征具有可比性2。
- 与其他预测模型的比较:在训练集中,XGBoost、RF 和 SVM 模型表现出色,AUC 和准确度都较高,CART 模型表现最差。在测试集中,XGBoost 模型的 AUC 为 0.914,准确度为 85.5%,在多个指标上优于其他模型。DCA 曲线显示,XGBoost 模型的净临床获益最佳;校准曲线表明,XGBoost 和 SVM 模型校准能力良好,预测值与实际值高度一致345。
- 基于特征的模型解释:通过计算和可视化 XGBoost 模型中各特征的 SHAP 值发现,CRP 和 WTOG24 h 对模型预测影响最为显著,低水平的 CRP 和 WTOG24 h 能显著降低模型预测为复杂性阑尾炎的概率。年龄、收缩压等其他特征虽有影响,但相对较小6。
研究结论表明,基于 XGBoost 算法构建的预测模型在预测急性阑尾炎进展为复杂性阑尾炎的风险方面表现卓越,具有很强的区分度和校准能力,泛化能力也较好。该模型仅依靠患者术前的生命体征、实验室检查和临床表现,就能有效提高区分复杂性和非复杂性阑尾炎的能力,优化了临床决策。这不仅减少了患者的经济负担和辐射暴露,还能在缺乏专业设备和人员的情况下辅助诊断,对改善患者预后、提高医疗资源利用效率意义重大。
不过,这项研究也存在一定局限性。它是单中心回顾性研究,样本数量有限,可能缺乏广泛代表性;回顾性研究本身也可能存在潜在偏差。但这并不影响其为后续研究指明方向,未来期待能有更多大样本、多中心的前瞻性研究,进一步验证和完善该模型,让 XGBoost 模型在医学领域发挥更大的作用,为更多患者带来福音。