
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习的光梯度提升机模型预测混合型胃癌患者五年全因死亡率的研究
【字体: 大 中 小 】 时间:2025年06月05日 来源:Holistic Integrative Oncology
编辑推荐:
本研究针对混合型胃癌患者预后评估的临床难题,创新性地应用机器学习(ML)技术构建预测模型。哈尔滨医科大学肿瘤医院团队通过开发LightGBM(LGBM)算法,实现了对五年全因死亡率的高精度预测(测试集AUC达0.835),并鉴定出pN分期、pTNM分期、肿瘤直径等8个关键预后因素。该研究为临床个体化治疗决策提供了重要工具,显著提升了混合型胃癌这一特殊亚型的精准诊疗水平。
胃癌作为全球发病率第五、癌症死亡率第四的恶性肿瘤,其治疗面临严峻挑战。在胃癌的Lauren分型中,混合型胃癌因其独特的生物学特性备受关注——它兼具弥漫型和肠型特征,淋巴转移风险更高,预后介于两者之间。然而,当前临床面临两个关键瓶颈:一是传统预测模型难以捕捉混合型胃癌复杂的预后因素关联,二是针对这一特殊亚型的专门研究严重不足。这种现状导致临床医生在制定个性化治疗方案时缺乏精准的决策依据。
为突破这些限制,哈尔滨医科大学肿瘤医院的研究团队开展了一项创新性研究。他们采用机器学习这一前沿技术,构建了针对混合型胃癌患者的五年全因死亡率预测模型。这项研究最终发表在《Holistic Integrative Oncology》期刊上,为混合型胃癌的精准诊疗提供了重要工具。
研究团队采用了多项关键技术方法:首先基于2014-2016年255例混合型胃癌患者的临床随访数据库,通过KNNImputer处理缺失值,采用递归特征消除(RFE)结合随机森林进行特征筛选;其次开发了包括逻辑回归(LR)、决策树(DT)、支持向量机(SVM)、k近邻(KNN)和光梯度提升机(LGBM)五种机器学习模型的比较体系;最后通过十折交叉验证和100次随机种子迭代确保模型稳定性,并使用独立测试集验证模型性能。
研究结果部分呈现了多项重要发现:
在患者特征方面,研究纳入了255例患者(男性74.9%),中位年龄58岁,T3分期占比最高(49.4%),pTNM III期占64.3%。训练集与测试集按7:3比例随机分配,两组基线特征均衡。
通过特征筛选确定了8个关键预后因素:pN分期、pTNM分期、肿瘤直径、手术根治性、纤维蛋白原(Fbg)水平以及肿瘤标志物CA199、CA724和CA125。这些因素在后续模型构建中展现出重要预测价值。
在模型性能比较中,LGBM表现最优:训练集平均AUC达0.887(标准差0.079),F1分数0.790;测试集最大AUC为0.835(95%CI:0.823-0.848),最低Brier分数0.172。显著优于其他四种传统模型。
风险分层应用显示,当以0.528为最佳截断值时,模型能有效区分高低风险组(P<0.001)。高风险组患者五年生存率显著降低,证实了模型的临床实用价值。
研究结论部分强调了多项重要意义:这是首个专门针对混合型胃癌亚型的机器学习预后预测研究,LGBM模型不仅实现了优异的预测性能(测试集AUC 0.835),更重要的是揭示了该亚型特有的8个关键预后因素。其中,pN分期、pTNM分期等传统因素与CA199等肿瘤标志物的组合,为临床评估提供了新视角。值得注意的是,模型预测分数与死亡风险呈明确正相关,这为风险分级治疗提供了量化依据。
讨论部分深入分析了研究的创新性与局限性:相比既往聚焦整体胃癌人群的研究,该研究首次明确了混合型胃癌的特异预后因素谱;LGBM算法较传统方法训练效率提升20倍以上,展现出技术优势。然而,研究的单中心回顾性设计可能引入选择偏倚,未来需要多中心前瞻性验证。此外,模型识别的高危患者是否需强化辅助治疗,值得进一步研究验证。
这项研究的临床转化价值显著:它为混合型胃癌这一特殊亚型建立了首个专用的预后预测工具,使医生能早期识别高危患者并调整治疗策略。随着精准医学的发展,这种基于机器学习的预测模型有望成为混合型胃癌个体化治疗的重要决策辅助,最终改善患者生存结局。未来研究可探索将模型与分子分型相结合,进一步提升预测精度,并为靶向治疗提供新思路。
生物通微信公众号
知名企业招聘