编辑推荐:
尿路上皮癌(UC)早期诊断和预后工具有限。研究人员开发基于全血细胞计数(CBC)的机器学习模型预测 UC 临床结局,纳入两中心队列,发现含白细胞(WBC)计数和淋巴细胞百分比(LYMPH%)的 LR 模型性能高,为 UC 预后提供新工具。
尿路上皮癌(UC)作为膀胱癌最常见亚型,同时也是上尿路的常见恶性肿瘤,给全球健康带来沉重负担。每年全球新增病例超 50 万,尽管有手术和全身治疗手段,但其复发率居高不下。当前主要依赖肿瘤淋巴结转移(TNM)分期和组织病理分级等预后工具,但这些方法难以捕捉临床结局的异质性,导致风险分层和个性化治疗决策不够理想。在医疗资源有限的地区,尤其需要经济、无创的生物标志物来提升预后准确性、指导治疗策略。全血细胞计数(CBC)作为一项常规且经济的血液学检查,能反映全身炎症和免疫反应,其衍生参数如中性粒细胞与淋巴细胞比值(NLR)等在多种癌症中显示出预后价值,但在 UC 中相关研究较为零散,缺乏整合到可靠预测模型中的研究。基于此,复旦大学附属徐汇医院和同济大学附属普陀人民医院的研究人员开展了一项研究,旨在开发并验证基于 CBC 参数的机器学习(ML)模型,以预测 UC 患者的临床结局,相关成果发表在《Clinica Chimica Acta》。
研究采用多中心回顾性队列研究,样本来源于复旦大学附属徐汇医院(发现队列,477 例)和同济大学附属普陀人民医院(验证队列,297 例),研究时间为 2010 年 6 月 1 日至 2020 年 12 月 31 日,收集患者治疗前及治疗后 3 个月的 23 项 CBC 变量,以总生存期(OS)为主要终点,开发并独立验证了 9 种机器学习模型。
研究结果
模型开发与验证
在发现队列中开发的 9 种机器学习模型经特征选择后,确定包含白细胞(WBC)计数和淋巴细胞百分比(LYMPH%)的逻辑回归(LR)模型为最优预测模型。该模型在发现队列中表现出色,受试者工作特征曲线下面积(AUC)为 0.93(95% CI:0.90–0.97),精确召回曲线下面积(AUPRC)为 0.94(95% CI:0.89–0.99),阳性预测值(PPV)为 0.87(95% CI:0.75–0.98),阴性预测值(NPV)为 0.82(95% CI:0.78–0.87),准确率为 0.83(95% CI:0.80–0.88),F1 分数为 0.82(95% CI:0.79–0.86)。验证队列中也取得了相当的结果,AUC 为 0.88(95% CI:0.84–0.93),AUPRC 为 0.81(95% CI:0.75–0.86),PPV 为 0.77(95% CI:0.71–0.84),NPV 为 0.89(95% CI:0.84–0.95),准确率为 0.84(95% CI:0.80–0.89),F1 分数为 0.80(95% CI:0.74–0.87)。
决策曲线分析与生存分析
决策曲线分析显示该模型具有一致的净获益。Kaplan–Meier 分析表明,“预测结局较差” 亚组的 OS 显著更短。治疗后,死亡患者的 WBC 计数升高、LYMPH% 降低,而存活患者呈现相反趋势(P<0.05)。
研究结论与讨论
本研究开发并验证的基于常规 CBC 参数的 ML 模型,为 UC 患者的预后评估带来了重要进展。通过将 23 项 CBC 衍生生物标志物整合到可解释的 ML 框架中,研究表明传统用于基础临床评估的血液学指标在预测 UC 患者生存和治疗反应方面具有未被充分挖掘的潜力。该模型性能稳健,优于传统统计方法,且利用常规可得的血液学数据,提供了一种可扩展的预后工具,能补充现有临床框架,有助于制定风险适应性治疗策略,改善患者预后。其简单、经济的特点使其在临床实践中,尤其是资源有限的环境中具有较高的应用价值,为 UC 的预后评估和个性化治疗提供了新的方向。