临床T1期肾肿物病理升级(≥pT3a)预测列线图的比较效能：一项独立外部验证研究

《International Urology and Nephrology》：Comparative performance of predictive nomograms for pathological upstaging in clinical T1 renal masses: an independent external validation

【字体：大中小】 时间：2026年06月10日 来源：International Urology and Nephrology 1.9

编辑推荐：

　　背景：术前识别临床T1(cT1)期肾肿物中发生病理升级(≥pT3a)的病例对手术方案制定至关重要。研究人员对Barra、Nocera及Mei三个已发表的预测模型进行外部验证，评估其在当代人群中的判别能力(Discrimination)、校准度(Calibrat

背景：术前识别临床T1(cT1)期肾肿物中发生病理升级(≥pT3a)的病例对手术方案制定至关重要。研究人员对Barra、Nocera及Mei三个已发表的预测模型进行外部验证，评估其在当代人群中的判别能力(Discrimination)、校准度(Calibration)及临床效用(Clinical Utility)。患者与方法：回顾性分析行手术治疗的cT1期肾肿物患者，主要终点为病理升级至pT3a。采用受试者工作特征曲线下面积(AUC)评估判别能力，布赖尔分数(Brier Score)评估总体准确性，参数与非参数Loess平滑曲线评估校准度，标准化决策曲线分析(Standardized Decision Curve Analysis, sDCA)量化临床效用。结果：本中心病理升级率为17.1%(19/111)，透明细胞组织学为主(77.5%)。Nocera列线图(AUC=0.736)和Barra列线图(AUC=0.733)的判别能力点估计值高于Mei列线图(AUC=0.677)，但差异无统计学意义。所有模型均呈描述性绝对风险高估趋势；Mei列线图显示最高的绝对校准稳定性，而Nocera列线图存在显著的整体不可靠性(U=0.052, p=0.021)。Barra列线图总体误差最低(Brier Score=0.122)，并在关键的8%–18%决策阈值窗口内获得最高临床净获益，尽管总体准确性差异无统计学意义。结论：三种列线图均为有用的风险分层辅助工具，但置信区间宽且事件发生数少使本研究结论为探索性。无单一模型具有绝对优势——Nocera和Barra适用于相对风险排序，Mei列线图可为患者咨询提供较优的绝对风险精度。

《临床T1期肾肿物病理升级(≥pT_3a)预测列线图比较效能的独立外部验证研究》论文解读

该研究发表于International Urology and Nephrology。目前临床T1(cT₁)期肾肿物(最大径≤7 cm)多首选保留肾单位手术(Nephron-Sparing Surgery, NSS)，但约10%–12%的cT₁肿瘤术后病理证实升级为病理T_3a(pT_3a)，即显微镜下侵犯肾周脂肪、肾窦脂肪或静脉结构。pT_3a升级与患者复发风险升高及癌症特异性生存率下降密切相关，直接影响术式选择(NSS vs 根治性肾切除术 Radical Nephrectomy, RN)、切缘范围及术后随访强度。已有Barra(侧重肿瘤最大径及与大血管接触)、Nocera(整合年龄、肿瘤大小、极位、内侧缘及外生率)及Mei(纳入年龄、症状、吸烟史、大小、肾门受累、血小板/淋巴细胞比值 Platelet-to-Lymphocyte Ratio, PLR、肿瘤轮廓不规则及CT坏死征象)三个预测列线图(Nomogram)，在其各自开发队列中判别能力尚可，但缺乏在同一独立外部队列中的横向比较与验证。因此研究人员开展此项回顾性外部验证研究，系统评价三者在判别能力(Discrimination)、校准度(Calibration)及临床效用上的表现，明确各模型的适用场景，为术前风险沟通与手术决策提供依据。研究发现三种模型均有一定价值但各有偏倚：Barra列线图在临床决策窗内净获益最佳，Nocera与Barra适合相对风险分层，Mei列线图在校准稳定性上最优更适合向患者传达绝对风险概率，这对术前个体化沟通及术式权衡具有重要参考价值。

主要关键技术方法：

研究人员回顾性纳入单中心2014–2025年间接受NSS或RN、术前影像诊断为单发cT₁肾肿物且病理资料完整的111例患者，排除多发/双侧肿瘤、初诊即有淋巴结或远处转移、遗传性肾癌综合征及预测变量数据不完整者。由一名对病理盲法的泌尿外科医师评估影像学特征，按原始公式分别计算Barra、Nocera及Mei列线图对每个患者的预测概率。主要结局为术后病理证实pT_3a(AJCC第8版)。统计学遵照TRIPOD声明：用受试者工作特征曲线下面积(Area Under the Curve, AUC)评估判别能力；布赖尔分数(Brier Score)和Nagelkerke's R²评估总体准确性；参数法计算截距、斜率及不可靠性指数(Unreliability Index, U)进行校准检验，非参数Loess平滑曲线及最大校准误差(E_max)、平均误差(E_avg)、90分位误差(E₉₀)评估校准漂移；标准化决策曲线分析(Standardized Decision Curve Analysis, sDCA)在多个阈值概率下计算标准化净获益(Standardized Net Benefit, sNB)，预设15%为NSS与RN抉择的相关阈值，以"全假定升级"和"全假定不升级"为对照策略。

研究结果

患者特征与病理结局

共纳入111例(男74例，女37例)，中位年龄65岁(IQR 55–71)，中位肿瘤直径3.5 cm(IQR 2.5–5.0)；52.4%为右侧。82.9%行NSS，17.1%行RN。透明细胞肾细胞癌(clear cell Renal Cell Carcinoma, ccRCC)占77.5%。术后pT_3a升级19例(17.1%)。单因素Logistic回归示肿瘤大小(OR 1.05, 95%CI 1.01–1.10, p=0.012)及接触主血管(OR 1.37, 95%CI 1.16–1.63, p<0.001)是升级显著预测因子，年龄(p=0.067)和肿瘤极位(p=0.087)未达显著性。结论：本队列已知危险因素得到重现，适合作为外部验证人群。

列线图效能：判别能力(Discrimination)

Nocera列线图AUC=0.736(95%CI 0.597–0.875)，Barra列线图AUC=0.733(95%CI 0.576–0.889)，Mei列线图AUC=0.677(95%CI 0.536–0.819)。DeLong检验两两比较差异均无统计学意义(p>0.05)。结论：Nocera与Barra判别相对风险排序能力略优于Mei，但三者判别能力无统计学显著差异，且均低于原开发队列报道值，符合外部验证常见现象。

全局校准与可靠性(参数法)

三模型校准截距均为负值(-0.310至-0.727)，校准斜率均<1(0.520–0.659)，提示普遍高估升级绝对风险。Mei列线图不可靠性指数最低(U=0.004, p=0.294)，无显著校准偏离；Barra列线图为临界(U=0.033, p=0.058)；Nocera列线图存在显著整体不可靠性(U=0.052, p=0.021)。结论：Mei列线图预测概率与观察结局一致性最好，Nocera在高风险区存在明显校准偏移。

非参数校准(Loess平滑)

Mei列线图跨风险谱最稳定，最大校准误差E_max=0.150；Barra与Nocera在预测高风险区出现明显校准漂移(高估真概率)，Nocera尤甚(E_max>0.34)。结论：Mei列线图适合用于向患者告知具体绝对风险概率；Barra与Nocera更擅长将患者按风险高低排序而非给出精确百分比。

总体预测准确性与分辨力

Barra列线图Brier Score最低(0.122)，Nagelkerke R²最高(0.141)，分辨力分量Q=0.046，但三模型间数值差异未达统计显著性。结论：Barra列线图在本队列总体预测误差最小，对临床风险区分有一定优势。

临床效用(Clinical Utility)

sDCA显示三模型在阈值概率>8%时sNB均大于"全假定不升级/全假定升级"策略。Barra列线图在外科决策关键窗(8%–18%，尤其15%阈值)获最高sNB，约捕获最大潜在获益的55%；>18%阈值时Nocera列线图sNB最高；Mei列线图sNB全程偏低但仍为正。结论：在常规决定是否行RN的阈值范围内，Barra列缘图提供最大临床净获益。

讨论部分总结

外部验证AUC(0.677–0.736)低于原研队列，反映人群异质性影响。Mei判别力偏低但校准最稳，Nocera判别好但校准差，Barra平衡两者在关键决策阈取得最优净获益。所有模型存负截距暗示绝对风险高估，因事件数少未做重校准以防过拟合。列线图仅为辅助，最终术式需综合肾功能、合并症、肿瘤生物学及患者意愿。需注意Nocera原为ccRCC专用，本研究用于混合组织学队列更接近真实术前情境但可致校准偏移。本研究受限于单中心回顾性设计、小样本及少事件数，结论为探索性，未来需多中心大样本验证及适当重校准，并关注影像、活检与分子标志物等进展对静态列线图的补充价值。

结论(翻译)

Barra、Nocera和Mei列线图均可作为识别cT₁期肾肿物高病理升级(pT_3a)风险的实用工具。所有模型效能均低于原报道值。对于主动性手术规划，Barra列线图在本队列中呈现出较优的性能平衡，在相关概率阈值范围内提供更好临床效用。由于所有模型在较高风险阈值处倾向于高估风险，临床医师在告知高风险谱患者时应谨慎解释预测结果。

热点排行