可解释机器学习模型精准预测儿童肾上腺皮质肿瘤生存预后
《Journal of the Endocrine Society》:Interpretable Machine Learning Model for Survival Prediction in Pediatric Adrenocortical Tumors
【字体:
大
中
小
】
时间:2025年11月19日
来源:Journal of the Endocrine Society 3.1
编辑推荐:
本研究针对儿童肾上腺皮质肿瘤(pACT)预后评估难题,开发了基于XGBoost的可解释机器学习模型。通过分析97例GPOH-MET登记患者数据,仅使用肿瘤体积、远处转移、pT分期和切除状态四个常规临床特征,模型即展现出优异预测性能(测试集C-index 0.925)。SHAP分析揭示了特征的非线性关系,特别是在局部晚期非转移患者中实现精准分层,为个性化治疗决策提供了新工具。
在儿童罕见肿瘤领域,肾上腺皮质肿瘤(pediatric adrenocortical tumors, pACT)以其临床异质性和预后不确定性著称。这类年发病率仅0.2-0.3/百万的肿瘤,在巴西等 endemic 地区可高达3/百万以上。尽管手术完全切除的小肿瘤预后良好,但大肿瘤或不完全切除患者复发率高达50%,而转移或复发患者的生存率更不足20%。当前基于固定阈值和线性假设的风险分层系统,在面对非转移性局部晚期病例时尤其显得力不从心。
传统评分系统如Wieneke评分、儿童肿瘤学组(Children's Oncology Group, COG)分期、五项显微镜评分、网状纤维算法以及儿科S-GRAS(pediatric S-GRAS, pS-GRAS)评分等,虽经多年验证,但其规则基础的本质难以捕捉临床、病理和生物学因素间复杂的非线性相互作用。与此同时,机器学习(machine learning, ML)在成人肾上腺皮质癌(adrenocortical carcinoma, ACC)预后预测中已展现潜力,但多依赖分子数据,在资源有限地区应用受限。针对pACT的ML预测模型尚属空白。
为此,德国多中心研究团队在《Journal of the Endocrine Society》发表最新研究,开发了首个基于常规临床特征的可解释ML生存预测模型。研究团队回顾性分析了德国儿科血液肿瘤学会-恶性内分泌肿瘤(GPOH-MET)登记处1997-2024年间97例pACT患者数据,通过系统评估11,737种特征组合,最终确定肿瘤体积、远处转移(M状态)、病理T分期(pT)和切除状态四个核心预测因子。
研究采用XGBoost Cox比例风险模型,通过分层80/20训练-测试分割、500次bootstrap迭代和Harrell's一致性指数(C-index)评估性能。为增强模型透明度,应用SHAP(SHapley Additive exPlanations)方法量化各特征对个体预测的贡献。技术方法上,研究主要依托:1)GPOH-MET登记处的多中心临床数据;2)XGBoost算法进行生存分析建模;3)SHAP框架实现预测解释;4)bootstrap重采样进行内部验证;5)Breslow估计器推导绝对生存概率。
最终模型在独立测试集表现出色,C-index达0.925,bootstrap校正后平均C-index为0.891(95% CI: 0.817-0.946)。时间依赖性Brier评分在整个随访期间保持低位,综合Brier评分(Integrated Brier Score, IBS)为0.09,显示良好校准性。嵌套交叉验证和learning curve分析证实模型稳健性,训练数据达60%时性能即趋稳定。
SHAP分析清晰展示各特征影响力:转移状态主导风险预测,肿瘤体积次之,随后是切除状态和pT分期。SHAP依赖图揭示肿瘤体积与风险间存在非线性关系——风险随体积增大陡升直至约1000mL后平台化;切除状态呈现明确二分效应,R1/R2切除显著增加风险;pT分期显示等级递进关系;转移状态则始终发挥最强风险增益作用。
通过SHAP引导的bootstrap分析,研究识别出190mL(95%百分位区间127-910mL)作为风险显著增加的体积阈值,低于常规200mL标准。该阈值在500次bootstrap迭代中表现稳定,>80%的cut-off值<400mL,为临床提供新的决策参考点。
按COG分期亚组分析显示,在晚期患者中ML风险评分显著区分预后:COG 3期患者中,ML-high组死亡风险是ML-low组的12.0倍(p=0.0027);COG 4期相应风险比为4.6(p=0.0155)。而在早期阶段(COG 1-2期)未见显著分层,与低事件率和良好总体预后相符。
两个局部晚期非转移性ACC案例生动展示模型临床应用价值:同为pT4、cM0、350mL肿瘤,R0切除患者3年生存率约88%,而R1/R2切除患者骤降至33%。SHAP力线图直观显示各特征贡献方向和幅度,使预测结果高度透明。
研究结论强调,该可解释ML模型仅用常规临床特征即可实现pACT个体化生存预测,特别在传统分期模糊的局部晚期病例中提供关键补充信息。模型捕捉的非线性关系和交互效应超越现有分类系统,SHAP解释框架确保预测透明可信。尽管存在样本量限制、需外部验证等局限,但这一工具为全球不同资源settings下的精准医疗提供可行方案,尤其有助于识别可能从强化辅助治疗中获益的高危患者。
未来研究方向包括整合分子特征(如TP53突变状态)和开展国际多中心验证。随着EXPeRT组和PARTNER4VRT项目推进,这一模型有望成为pACT标准诊疗工具包的重要组成部分,最终改善这类罕见肿瘤患儿的生存结局。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号