基于机器学习算法的乳腺癌肝转移个体化预后预测模型构建及原发灶手术预后影响的多中心研究
【字体:
大
中
小
】
时间:2025年10月14日
来源:Frontiers in Endocrinology 4.6
编辑推荐:
本刊推荐:本研究基于SEER数据库4817例乳腺癌肝转移(BCLM)患者数据,采用随机森林(RF)等五种机器学习算法构建了个体化预后预测模型,首次系统评估了原发灶手术(PTS)对BCLM患者总生存期(OS)和乳腺癌特异性生存期(BCSS)的长期影响。模型通过逆概率加权处理(IPCW)和外部验证(AUC达0.779-0.815)证实其优越性能,SHAP分析揭示化疗、年龄、分子分型为关键预测因子。时间依赖性Cox回归显示PTS可降低死亡风险(OS:HR=0.80;BCSS:HR=0.77),为BCLM个体化治疗策略提供了循证依据。
乳腺癌(BC)已成为全球发病率最高的恶性肿瘤,肝转移(BCLM)发生率高达50%-61%,患者中位生存期仅4-8个月,5年生存率低至27%。目前缺乏BCLM特异性治疗指南,且临床异质性显著,亟需建立精准预后工具指导个体化治疗。
研究纳入SEER数据库(2010-2020年)4817例初诊BCLM患者,外部验证队列含中国江门市中心医院(JCH)及汕头大学医学院附属肿瘤医院(CHSU)124例患者。通过单因素/多因素Cox回归筛选预测因子,采用随机森林(RF)、逻辑回归(LR)、XGBoost、决策树(DT)和梯度提升树(GBDT)五种机器学习算法预测6个月、1年、3年及5年的OS和BCSS。应用逆概率删失加权(IPCW)处理终点标签,通过IPCW-AUC、校准曲线、决策曲线分析(DCA)和SHAP值评估模型性能。针对原发灶手术(PTS)的预后影响,采用时间依赖性Cox模型、Simon-Makuch曲线、分段Cox模型及2个月界标分析,并通过E值评估未测量混杂偏倚。
RF模型在训练集中预测OS的AUC为0.840-0.899,BCSS为0.849-0.867;内部验证中OS的AUC为0.763-0.787,BCSS为0.765-0.787。外部验证显示RF模型区分度稳定(OS的AUC:0.779-0.812,BCSS的AUC:0.784-0.815)。SHAP分析表明化疗、年龄、分子分型(HR+/HER2- vs HR-/HER2+)和手术为最重要预测因子。敏感性分析排除未知分级患者后模型性能未显著下降(外部验证AUC:0.772-0.848),证实模型稳健性。
时间依赖性Cox回归显示PTS可降低全因死亡风险(OS:HR=0.80, 95%CI 0.72-0.88)和乳腺癌相关死亡风险(BCSS:HR=0.77, 95%CI 0.69-0.86)。分段Cox模型进一步证实PTS的持续保护作用(0-24个月OS的HR=0.83,>24个月OS的HR=0.73)。2个月界标分析中PTS组OS的HR=0.60(95%CI 0.37-0.97),E值分析(OS的E值=1.81)提示结论对中等强度未测量混杂因素稳健。
本研究构建了目前最大样本量的BCLM预后预测模型,RF算法在跨种族验证中均展现优异性能。多方法学验证一致表明PTS与生存改善相关,尤其适用于经系统治疗筛选的患者群体。研究局限性包括SEER数据库缺乏靶向治疗细节及肿瘤进展数据,未来需前瞻性研究验证模型临床适用性。
RF模型可精准预测BCLM患者长期生存,PTS在个体化筛选患者中展现生存获益,支持多学科诊疗框架下综合评估原发灶手术价值。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号