
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于体成分与炎症营养指数(BCINI)的可解释机器学习模型预测结直肠癌术后早期复发:一项多中心研究
【字体: 大 中 小 】 时间:2025年05月23日 来源:Computer Methods and Programs in Biomedicine 4.9
编辑推荐:
本研究针对结直肠癌(CRC)术后早期复发(ER)预测难题,通过整合CT体成分指标与血液炎症营养参数(BCINI),采用XGBoost等6种机器学习算法构建预测模型。结果显示XGBoost模型表现最优(AUC 0.837),经多中心验证证实其稳定性(AUC 0.773-0.783),SHAP分析增强临床可解释性。该研究为CRC术后个性化监测提供无创、低成本决策工具。
结直肠癌(CRC)作为全球第三大常见恶性肿瘤,术后复发仍是导致患者死亡的主要原因。尽管根治性手术显著延长了非转移性CRC患者的生存期,但约60%的复发发生在术后2年内,被定义为早期复发(ER)。目前临床依赖的TNM分期系统难以全面反映复发复杂性,而传统营养指标如体重指数(BMI)又存在"肥胖悖论"争议。更棘手的是,CRC患者普遍存在的癌性恶病质状态使预后评估更加困难。
面对这些挑战,江西省肿瘤医院联合南昌大学两家附属医院的研究团队创新性地将CT体成分分析与炎症营养血液标志物相结合,开发基于可解释机器学习(ML)的预测工具。这项发表在《Computer Methods and Programs in Biomedicine》的研究,通过多中心数据验证,为CRC术后复发预测提供了新思路。
研究团队采用三阶段技术路线:首先从436例CRC患者中提取CT体成分参数(骨骼肌、内脏脂肪等)和12项血液指标(包括中性粒细胞-淋巴细胞比值NLR、预后营养指数PNI等);接着通过LASSO回归筛选特征变量;最后比较XGBoost、随机森林(RF)等6种ML算法性能。所有模型均经过内部验证和两个外部数据集(共238例)测试,并采用SHAP值进行预测过程可视化。
研究结果
基线特征
纳入的540例患者中21.7%发生ER,平均年龄57岁。训练集(Hospital A)与测试集(Hospitals B/C)的ER发生率分别为19.5%、22.9%和25.6%。
模型性能
XGBoost在内部验证中表现最优,训练集AUC达0.837,显著优于其他算法。外部验证中,该模型在两个独立数据集分别获得0.783和0.773的AUC值,且在年龄分组(<60岁AUC 0.762-0.834)和肿瘤部位分组(结肠癌AUC 0.785-0.845)中均保持稳定。
临床可解释性
SHAP分析揭示骨骼肌指数(SMI)、内脏脂肪面积(VFA)和SII(全身炎症指数)是影响预测的最重要变量。其中低SMI与高ER风险显著相关,印证了肌肉减少症对预后的负面影响。
讨论与意义
该研究首次系统整合CT体成分与炎症营养指标构建ML预测模型,其优势体现在三方面:一是突破传统分期局限,利用常规检查数据实现无创预测;二是XGBoost模型在保持精度的同时,通过SHAP实现"黑箱"可视化;三是多中心验证确保临床适用性。研究提出的BCINI框架为个体化随访策略制定提供依据,如对高风险患者可加强影像监测或调整辅助治疗方案。
值得注意的是,模型采用的指标均来自常规诊疗,不增加额外费用。骨骼肌和内脏脂肪的量化评估不仅反映营养状态,更与胰岛素抵抗、慢性炎症等复发机制相关。这种将机体微环境与ML相结合的思路,为其他肿瘤预后研究提供了可借鉴的方法学范式。未来研究可进一步探索动态BCINI变化与复发风险的关联。
生物通微信公众号
知名企业招聘