编辑推荐:
直肠癌患者临时回肠造口延迟闭合会带来多重负担。研究人员开展基于机器学习的预测模型研究,采用 LASSO 和 XGBoost 等,发现模型性能良好,SHAP 可解释结果,为临床决策提供新工具。
在消化系统肿瘤的治疗领域,直肠癌(RC)是常见的恶性肿瘤之一,其发病率在全球范围内位居前列。对于直肠癌患者,手术是重要的治疗手段,但术后临时回肠造口的延迟闭合问题一直困扰着临床。临时回肠造口延迟闭合不仅会给患者带来心理、生理上的痛苦,还会增加社会经济负担,如造口相关并发症发生率上升、生活质量下降以及医疗成本增加等。目前,关于回肠造口闭合时机缺乏统一标准,临床实践中存在较大差异,因此,开发一种能够准确预测延迟闭合风险的模型,对于优化临床决策、改善患者预后具有重要意义。
为解决这一问题,中山大学肿瘤防治中心的研究人员开展了相关研究。他们基于机器学习方法,构建并验证了一个预测直肠癌术后回肠造口延迟闭合的模型,相关研究成果发表在《World Journal of Surgical Oncology》。
研究人员采用回顾性研究设计,收集了 2022 年 1 月 1 日至 2023 年 12 月 31 日期间在中山大学肿瘤防治中心接受全直肠系膜切除术(TME)并进行临时回肠造口的直肠癌患者数据。通过严格的纳入和排除标准,最终纳入 442 例患者,其中 305 例发生延迟闭合(69%)。研究中主要使用了 LASSO 回归进行特征筛选,XGBoost 算法构建机器学习模型,并通过接收者操作特征曲线(ROC)、校准曲线、临床决策曲线(DCA)等评估模型性能,同时利用 SHAP(SHapley Additive exPlans)方法对模型进行解释。
患者特征与特征选择
研究对患者的基本特征进行分析,发现延迟闭合组与非延迟闭合组在年龄、BMI、肿瘤距肛缘距离、淋巴结转移、肿瘤浸润深度、新辅助放化疗、术后化疗及吻合口狭窄等方面存在显著差异(P<0.05)。通过 LASSO 回归从 14 个变量中筛选出 7 个预测变量,进一步经逐步多因素 logistic 回归排除年龄后,确定 BMI、肿瘤距肛缘距离、肿瘤浸润深度、新辅助放疗、术后化疗和吻合口狭窄为 6 个独立变量,用于构建模型。
模型性能评估
XGBoost 模型在训练集和测试集上均表现出良好性能。训练集的曲线下面积(AUC)为 0.744(95% CI:0.686–0.806),测试集的 AUC 为 0.809(95% CI:0.728–0.889)。模型在训练集和测试集的灵敏度分别为 0.939 和 0.945,特异性分别为 0.312 和 0.415,F1 分数分别为 0.836 和 0.859。校准曲线显示模型预测与实际发生率拟合良好,临床决策曲线表明模型具有较高的临床实用价值。
模型解释
利用 SHAP 方法对模型进行解释,结果显示各变量的重要性排序为:BMI > 术后化疗 > 肿瘤距肛缘距离 > 肿瘤浸润深度 > 新辅助放疗 > 吻合口狭窄。通过 SHAP 力图对典型患者进行分析,直观展示了不同变量对预测结果的贡献方向和强度。例如,“真阳性” 患者组中,较高的 BMI、术后化疗等因素使 SHAP 值升高,提示延迟闭合风险增加;而 “真阴性” 患者组中,相关因素的负向贡献使 SHAP 值低于参考值,提示无延迟闭合发生。
讨论与结论
该研究首次构建了基于 SHAP 可解释的 XGBoost 模型来预测直肠癌术后临时回肠造口延迟闭合。研究结果表明,BMI、术后化疗、肿瘤位置等因素是延迟闭合的重要风险因素。其中,BMI≥24.0 kg/m2、术后化疗及新辅助放疗等与延迟闭合显著相关,这可能与肥胖导致造口并发症增加、放化疗影响患者恢复及手术耐受性有关。肿瘤距肛缘距离较近可能导致吻合口张力大、愈合不良,进而促使临床决策延迟闭合。吻合口狭窄作为独立风险因素,可能与影响肠道通畅性有关。
与传统的多线性回归模型相比,该研究采用的机器学习方法能够更好地处理多变量间的非线性关系,提高了模型的准确性和泛化能力。LASSO 回归的应用有效避免了过拟合问题,SHAP 方法则增强了模型的可解释性,有助于临床医生理解预测结果的依据。
尽管研究存在单中心、样本量相对较小、未纳入糖尿病等潜在影响因素等局限性,但其构建的模型仍为临床提供了新的视角和工具。未来需进一步开展多中心、大样本的前瞻性研究,验证模型的普适性,并将其整合到临床工作流程中,通过对高风险患者进行早期干预和密切随访,优化回肠造口闭合时机的决策,从而降低延迟闭合发生率,改善患者生活质量,减少医疗资源浪费。该研究为直肠癌术后管理提供了创新思路,推动了机器学习在肿瘤临床中的应用发展。