预测局部晚期直肠癌对新辅助放化疗病理反应的创新模型

【字体: 时间:2025年03月23日 来源:Scientific Reports 3.8

编辑推荐:

  为解决局部晚期直肠癌(LARC)新辅助放化疗(nCRT)反应预测难题,研究人员构建模型,其性能优异,助力临床决策。

  在直肠癌的治疗领域,新辅助放化疗(nCRT)是局部晚期直肠癌(LARC)患者手术前的重要治疗手段。它能够缩小肿瘤体积,降低局部复发风险,提高手术成功率,改善患者预后。更令人期待的是,对于那些在 nCRT 后达到病理完全缓解(pCR)的患者,甚至有可能避免手术,极大地提升生活质量。然而现实却不尽如人意,只有 15 - 27% 的患者能达到 pCR,患者对 nCRT 的反应存在显著个体差异 。这背后是肿瘤生物学的高度异质性和个体基因表达的复杂性在 “作祟”。当前的临床评估方法难以精准预测患者对 nCRT 的反应,导致部分患者承受不必要的副作用,却无法获得治疗益处。在追求精准医疗的时代,寻找能预测 nCRT 反应的新生物标志物迫在眉睫,这对于优化 LARC 患者治疗方案、减少过度治疗或治疗不足意义重大。
江西理工大学信息工程学院、赣南医学院第一附属医院医学大数据与生物信息学研究中心等机构的研究人员开展了一项旨在识别有效预测生物标志物,并开发基于集成学习的预测模型,以评估 LARC 患者对 nCRT 反应的研究。该研究成果发表在《Scientific Reports》上。

研究人员采用了一系列关键技术方法。数据来源于基因表达综合数据库(GEO)的 GSE87211 和 GSE40492 数据集。利用样本内相对表达排序(REOs)构建基因对,通过两步特征选择法筛选预测生物标志物。初步筛选运用了多维特征选择(MDFS)、Boruta、蒙特卡罗特征选择(MCFS)和 VSOLassoBag 四种方法,再通过增量特征选择(IFS)结合极端梯度提升(XGBoost)进行二次筛选。最终选用集成学习方法 BoostForest 构建预测模型,并使用 SHAP 进行可解释性分析。

下面来看具体的研究结果:

  • 差异分析:对 GSE87211 训练队列中的 21 个 pCR 样本和 85 个非 pCR 样本进行差异表达分析,共鉴定出 201 个差异表达基因(DEGs),其中 86 个上调,115 个下调。GSE87211 和 GSE40492 数据集的 DEGs 一致性分析显示,一致性率达 0.966,表明两个数据集的基因表达变化趋势高度一致。
  • 特征选择:通过 REOs 算法初步筛选出 5487 个稳定反转基因对,再经两步特征选择法,确定了由 32 个基因对组成的特征集(32 - GPS)作为最终预测生物标志物。
  • 预测模型性能评估:以 GSE87211 数据集为训练队列,内部验证时将其按 7:3 比例随机分为训练集和测试集。BoostForest 模型在测试集中表现出色,精度 - 召回曲线下面积(AUPRC)达到 0.983,准确率为 0.988。在 GSE40492 验证队列中,AUPRC 为 0.785,准确率为 0.898。与随机森林(RF)、支持向量机(SVM)和 XGBoost 等模型相比,BoostForest 在整体性能上更具优势。研究还对比了 32 - GPS 与其他特征集的性能,结果显示 32 - GPS 在预测性能上更优。
  • 通路富集分析:对 32 - GPS 中的基因进行基因本体(GO)和京都基因与基因组百科全书(KEGG)富集分析。GO 富集分析表明,72.54% 的基因富集于蛋白质结合,19.61% 富集于细胞外外泌体等。KEGG 富集分析显示,这些基因主要富集于癌症转录失调、代谢途径和肌动蛋白细胞骨架调节等通路。
  • 生存分析:对 GSE87211 和 GSE40492 数据集进行无病生存期(DFS)的生存分析。结果显示,pCR 组的生存概率明显优于非 pCR 组,但经多重检验校正后,部分差异未达到统计学意义。
  • 模型可解释性分析:利用 SHAP 方法分析发现,CTNNBIP1 > ZNF544、CHRNA5 > CFH 等基因对模型预测影响显著。部分基因在 pCR 和非 pCR 患者间表现出明显的区分能力。

综合研究结论和讨论部分,研究人员通过 REOs 构建基因对,经两步选择法确定 32 - GPS,并以 BoostForest 为预测模型,在预测 LARC 患者对 nCRT 反应方面展现出良好性能。与传统分类模型相比,BoostForest 在准确性和预测能力上更胜一筹。这一研究成果为临床医生制定个性化治疗策略提供了可靠依据,有助于减少过度治疗或治疗不足的情况,推动直肠癌精准治疗的发展。但该研究也存在一定局限性,样本量相对较小,限制了方法和模型性能的充分展现,未来需更大、更多样化的队列进行验证,还需开展多中心研究和临床验证,以提升模型在临床实践中的可靠性和适用性。<
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号