
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习与列线图模型的"双侵袭"非转移性胃癌预后预测系统构建及个体化诊疗策略优化
【字体: 大 中 小 】 时间:2025年06月24日 来源:European Journal of Medical Research 2.8
编辑推荐:
本研究针对同时存在血管和神经浸润("双侵袭")的非转移性胃癌患者术后复发预测难题,创新性整合随机生存森林(RSF)、决策生存树(DST)和极限梯度提升(XG Boosting)三种机器学习算法,构建了优于传统列线图的预测模型(最高C-index达0.791)。通过纳入CD56、FHIT等分子标志物在内的9项关键变量,建立的风险分层系统可精准识别高危患者,为术后辅助化疗决策提供量化依据,推动胃癌精准医疗发展。
胃癌作为全球第五大常见恶性肿瘤,其治疗面临的核心挑战在于术后复发预测的准确性。尤其当肿瘤细胞同时侵犯血管和神经(即"双侵袭"现象)时,患者预后显著恶化,但现有TNM分期系统对此类特殊群体的预测效能有限。临床亟需能整合多维度数据的智能预测工具,以解决个体化治疗决策的"盲区"问题。
山西省肿瘤医院联合山西医科大学第三医院的研究团队开展了一项突破性研究,通过对559例接受根治性胃切除术的"双侵袭"胃癌患者进行回顾性分析,首次将机器学习算法与传统列线图模型深度融合。研究创新性地发现,随机生存森林(RSF)算法在预测3年/5年无复发生存期(RFS)时展现出0.791的C-index值,显著优于临床常用的AJCC第8版TNM分期系统(0.543)。相关成果发表于《European Journal of Medical Research》,为胃癌精准医疗提供了新范式。
研究团队采用三大关键技术方法:1)多中心回顾性队列构建(2005-2022年388例训练集/171例验证集);2)机器学习算法优化(RSF/DST/XG Boosting十折交叉验证);3)多参数列线图整合(含CD56、FHIT等9项生物标志物)。通过SHAP值解析和决策曲线分析(DCA)验证模型临床效用。
主要研究结果
机器学习模型评估
RSF模型表现出最优预测性能(C-index 0.791),其SHAP分析揭示阳性淋巴结数量(特征重要性得分0.06)、最大肿瘤直径和年龄为三大核心预测因子。当阈值概率为0.2-0.5时,RSF的临床净获益率较传统模型提升35%。
列线图开发与验证
整合RSF算法筛选的9个变量构建的列线图,在外部验证中5年RFS预测AUC达0.644(95%CI:0.519-0.824),校准曲线显示预测/观察事件比接近1:1。
风险分层系统
基于X-tile软件划定风险阈值(165.66分),将患者分为高低危组:高危组中位RFS仅24个月,显著低于低危组的77个月(p<0.001)。
讨论与展望
该研究首次证实FHIT蛋白低表达与"双侵袭"胃癌不良预后显著相关(HR=1.82),其通过调控胸苷激酶1(TK1)导致基因组不稳定的机制值得深入探索。CD56作为自然杀伤细胞标记物的双重作用提示肿瘤免疫微环境调控的重要性。
研究的临床转化价值体现在三方面:1)为拒绝过度治疗的low-risk患者提供循证依据;2)指导high-risk患者接受强化辅助治疗;3)创新性提出的"机器学习+列线图"混合模型架构,可扩展应用于其他癌种的预后预测。未来需通过前瞻性多中心研究验证模型普适性,并探索将放射组学等多组学数据纳入预测体系。


生物通微信公众号
知名企业招聘