基于多中心临床数据的机器学习模型预测肺癌脑转移患者生存预后的研究

【字体: 时间:2025年06月28日 来源:International Journal of Medical Informatics 3.7

编辑推荐:

  肺癌脑转移(LCBM)患者预后评估是临床决策的难点。哈尔滨医科大学肿瘤医院联合SEER数据库(n=2624+362),通过Cox回归筛选预后因子,构建XGBoost等8种机器学习模型。结果显示XGBoost模型表现最优(平均AUC 0.957),证实淋巴结转移为独立预后指标(p<0.001),为个体化治疗提供动态风险评估工具。

  

肺癌是全球发病率和死亡率最高的恶性肿瘤之一,其中脑转移是导致患者预后极差的重要因素。约50%的非小细胞肺癌(NSCLC)患者病程中会出现脑转移(LCBM),伴随脑膜转移者中位生存期仅2-4个月。尽管手术、放疗、靶向治疗等多模式治疗手段不断进步,但患者总体预后仍不理想,且神经系统功能障碍严重影响生活质量。传统预后模型因临床变量有限、统计方法简单,预测准确性受到制约。

针对这一临床难题,哈尔滨医科大学肿瘤医院联合美国SEER数据库,开展了一项基于多中心数据的大规模研究。研究团队整合SEER数据库(2010-2015年)2624例和本院362例LCBM患者数据,通过机器学习技术构建预后预测模型。该成果发表于《International Journal of Medical Informatics》,为临床决策提供了智能化工具。

研究采用Cox回归筛选预后因素,构建了包括XGBoost、随机森林等8种机器学习模型。关键技术涉及:1) 从SEER数据库和医院电子病历提取结构化临床数据;2) 应用倾向性评分匹配(PSM)控制混杂因素;3) 开发XGBoost-Surv框架处理生存数据;4) 通过AUC、C-index等指标评估模型性能。

【Study population】
严格筛选2010-2015年SEER数据库中经ICD-O-3/WHO 2008确诊的LCBM患者,排除随访不全或治疗史不明病例。医院队列纳入362例经病理确诊患者,两组基线特征均衡可比。

【Population features】
SEER队列中60-69岁占35.983%,白人78.334%,已婚57.594%;医院队列中60-69岁占40.055%,汉族94.481%。两组在TNM分期、治疗方式等关键变量上无显著差异(p>0.05)。

【Results】
XGBoost模型表现最优:训练集C-index=0.653,AUC=0.731;测试集C-index=0.634,AUC=0.705。确认年龄≥60岁、T3分期、多器官转移为风险因素(p<0.001),女性、家庭收入≥10万美元为保护因素。淋巴结转移显著影响预后(p<0.001),但不同转移分期差异无统计学意义(p=0.935)。

【Discussion】
研究创新性体现在:1) 首次将XGBoost-Surv框架应用于LCBM生存分析,支持连续时间点概率预测;2) 通过SHAP值实现模型可视化解释;3) 验证收入水平等社会经济因素对预后的影响。模型稳定性经Bootstrap重采样验证(95%CI 0.612-0.689)。

【Conclusion】
该研究构建的XGBoost模型能准确预测LCBM患者生存预后,淋巴结转移作为独立预后指标。模型整合临床-社会多维数据,通过动态风险评估辅助个体化治疗决策,推动精准医疗实践。研究获北京市医卫基金会(YWJKJJHKYJJ-TB23008)和吴阶平医学基金会(320.6750.2023-05-145)资助。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号