机器学习在预测肾细胞癌患者无进展生存期和总生存期中的应用
《Clinical and Translational Science》:Application of Machine Learning for Predicting Progression-Free and Overall Survival in Patients With Renal Cell Carcinoma
【字体:
大
中
小
】
时间:2025年10月24日
来源:Clinical and Translational Science 2.8
编辑推荐:
肾细胞癌(RCC)患者生存预测研究显示,基于肿瘤生长抑制(TGI)指标和基线数据的树状机器学习模型(随机森林RSF、XGBoost)在预测无进展生存期(PFS)和总生存期(OS)方面显著优于传统参数(加速失败时间AFT)和非参数(Cox比例风险模型)统计方法,C-index和集成Brier评分均更优,且仅需3-5个关键变量(如肿瘤生长率常数KL、药物细胞杀伤率常数KD),传统方法需9-35个变量。SHAP分析揭示非线性交互关系,TGI指标(KL、LAM、KD)和临床指标(ECOG评分、淋巴细胞比例)为重要预测因子,模型在测试集和不同治疗方案中均表现稳健,为精准医学和药物开发提供新工具。
在肾细胞癌(RCC)的治疗领域,患者预后仍然存在显著挑战。尽管现有的治疗手段在一定程度上能够延长生存时间,但五年的生存率仅在10%到30%之间,表明对疾病进展的准确预测仍是一个未满足的临床需求。随着精准医学的发展,早期预测治疗效果对于优化个体化治疗方案、加速新药研发以及改善患者管理具有重要意义。然而,传统的统计模型在预测生存时间方面存在局限性,包括对变量间关系的线性假设、对高维数据的处理能力不足,以及在临床实践中解释性较差等问题。近年来,机器学习(ML)方法因其在建模复杂非线性关系和处理大规模数据方面的优势,逐渐成为提升生存预测性能的有力工具。然而,ML方法在RCC中的应用仍处于探索阶段,尚未广泛验证其有效性。
本研究通过整合肿瘤生长抑制(TGI)指标与基线临床和人口学数据,对RCC患者的无进展生存期(PFS)和总生存期(OS)进行了预测分析。研究对象来自四个临床试验,包括接受索拉非尼、阿西替尼、舒尼替尼、干扰素-α以及阿维鲁单抗联合阿西替尼治疗的1839名患者。通过将数据分为训练集(70%)和测试集(30%),并采用特征选择方法筛选出关键预测变量,研究团队评估了多种传统统计模型(如参数模型AFT和半参数模型Cox Proportional-Hazards)以及机器学习模型(如随机生存森林RSF和极端梯度提升XGBoost)在预测PFS和OS方面的表现。同时,使用Bootstrap重采样(100次)对模型进行了验证,并采用C指数和整合布里尔分数(IBS)作为评估指标,分别衡量模型的区分能力和校准精度。
研究结果表明,基于树的机器学习模型在预测PFS和OS方面优于传统方法。在训练集上,RSF和XGBoost的C指数分别为0.785和0.783,显著高于参数模型(0.725–0.738)和半参数模型(0.725–0.738)。在测试集上,RSF和XGBoost同样表现出优越的预测能力,其C指数分别为0.739和0.75,而传统模型的C指数较低(0.725–0.758)。此外,RSF在使用较少变量(仅3–5个)的情况下,其预测效果与传统方法(需要9–35个变量)相当,甚至更好,显示出更高的模型简洁性和实用性。在IBS指标上,RSF在训练集上的表现也优于其他模型,进一步证明其在生存预测中的可靠性。
研究还利用SHAP(SHapley Additive exPlanations)分析对模型的可解释性进行了深入探讨。SHAP分析揭示了预测变量之间的非线性关系,特别是TGI指标(如肿瘤生长速率常数KL)与其他临床参数之间的复杂相互作用。这一发现不仅解释了树模型在预测性能上的优势,还强调了TGI指标在临床预后评估中的重要性。例如,KL的高值与疾病进展风险增加相关,而KD(细胞杀伤速率常数)和TTG(肿瘤生长时间)则与较低的进展风险相关。此外,中性粒细胞与淋巴细胞比值(NLR)和ECOG评分也被证明是重要的预测因子,尤其是在OS预测中。这些结果表明,树模型不仅能够捕捉复杂的非线性关系,还能在实际应用中提供更直观、易于理解的预测机制,从而增强临床医生对模型结果的信任度。
在不同的治疗亚组中,模型的预测能力也得到了验证。研究团队将模型应用于不同的药物治疗组,发现RSF和XGBoost在预测PFS和OS方面具有良好的一致性。对于PFS,RSF在测试集上的预测曲线与Kaplan-Meier观察结果保持一致,尤其在使用阿西替尼和索拉非尼治疗的患者中表现最佳。然而,在接受阿维鲁单抗联合阿西替尼治疗、舒尼替尼以及干扰素-α的患者群体中,观察到的生存时间低于预测值,这可能与这些治疗的复杂性和个体差异有关。对于OS,RSF在所有治疗组中均表现出较好的预测能力,且其预测曲线与实际观察结果基本吻合,直至200周的随访时间。
值得注意的是,研究团队还发现,某些治疗相关因素(如舒尼替尼剂量调整)在模型预测中具有显著影响。SHAP分析显示,剂量减少或中断与较低的疾病进展风险相关,这可能反映了患者对药物的耐受性提高,从而延长了治疗时间,但并未影响治疗效果。这一发现与先前的研究一致,强调了药物暴露与生存时间之间的潜在关系。此外,NLR在预测OS方面也表现出重要性,这提示其可能作为一项低成本、易获取的生物标志物,用于指导临床决策和患者分层。
本研究的结果不仅在预测性能上优于传统方法,还为临床实践提供了新的思路。通过整合TGI指标和临床数据,研究团队展示了机器学习在精准医学中的潜力,特别是在处理复杂的疾病动态和患者异质性方面。同时,研究也强调了模型可解释性的重要性,指出SHAP分析能够帮助临床医生理解模型的预测逻辑,从而更好地应用于实际治疗决策。尽管本研究的模型在多个方面表现出色,但其在不同种族和民族群体中的泛化能力仍需进一步验证。此外,由于TGI指标需要较长的随访时间才能准确估算,如何在较短随访时间内生成可靠的肿瘤生长参数,仍是未来研究的重要方向。
总体而言,这项研究为肾细胞癌的生存预测提供了新的工具和方法,同时展示了机器学习在处理复杂医学数据方面的潜力。通过结合TGI指标和临床变量,树模型不仅提高了预测的准确性,还增强了模型的可解释性,使其更适用于临床决策。此外,研究还为未来的临床试验设计和个体化治疗方案提供了支持,通过动态风险分层和精准患者筛选,有望提高临床试验的效率和成功率。未来的工作应进一步探索这些模型在不同治疗方案和患者群体中的适用性,并结合更广泛的临床数据集进行验证,以确保其在实际应用中的稳定性和可靠性。此外,随着深度学习技术的发展,研究者可以尝试在较短的随访时间窗口内生成TGI指标,从而实现更早的疗效评估和决策支持。这些进展将有助于推动肾细胞癌治疗的精准化和个体化,最终改善患者的预后和生活质量。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号