基于人工智能的OncoE25模型预测早发性I-III期结直肠癌术后预后的多中心验证研究

【字体: 时间:2025年06月24日 来源:Journal of Translational Medicine 6.1

编辑推荐:

  本研究针对早发性结直肠癌(EOCRC)发病率上升但缺乏专属预后工具的临床困境,开发了基于随机生存森林(RSF)的OncoE25人工智能模型。研究团队利用SEER数据库和双中心队列,通过LASSO-Cox特征筛选和六种机器学习算法比较,证实RSF模型在预测癌症特异性生存(CSS)方面显著优于传统TNM分期(C-index达0.829),并构建了在线风险计算器。该研究为50岁以下结直肠癌患者的个体化预后评估提供了可靠工具。

  

在全球结直肠癌(CRC)发病率整体下降的背景下,50岁以下早发性结直肠癌(EOCRC)的病例却逆势增长,过去三十年增幅高达45%。这一特殊群体在分子特征、临床表型和治疗反应等方面与晚发性结直肠癌(LOCRC)存在显著差异,但临床上仍沿用传统TNM分期系统进行预后评估,缺乏针对EOCRC的专属预测工具。更复杂的是,结肠癌与直肠癌在解剖位置、治疗策略和复发模式上的差异,使得开发精准的亚型特异性预测模型成为当务之急。

上海中医药大学附属普陀医院和岳阳中西医结合医院的研究团队开展了这项开创性研究。他们从SEER数据库中筛选了3,997例早发性结肠癌和2,016例早发性直肠癌患者,并收集了358例中国患者队列进行外部验证。研究采用LASSO-Cox进行特征选择后,系统比较了随机生存森林(RSF)、LASSO-Cox、生存支持向量机(S-SVM)、XGBSE、GBSA和DeepSurv六种算法的预测性能。

关键技术方法包括:基于SEER数据库(2010-2021年)的17个注册中心数据构建训练/测试队列(7:3分割);从中国两家医院获取独立验证队列;使用LASSO-Cox进行特征工程;通过C-index、时间依赖性AUC和Brier评分等指标评估模型性能;采用SHAP值进行特征重要性分析;基于风险评分构建三分层系统并开发在线计算工具。

模型开发与验证
研究首先证实EOCRC患者的癌症特异性生存(CSS)显著优于LOCRC(P<0.001)。在六种算法中,RSF模型展现出最优且稳定的预测性能:在早发性结肠癌测试队列中C-index为0.738,外部验证队列达0.829;早发性直肠癌中分别为0.728和0.722。其时间依赖性AUC均值在结肠癌外部验证队列高达0.889,显著超越传统TNM分期系统(平均AUC 0.709)。

模型解释与关键特征
SHAP分析揭示了TNM分期是最强预测因子,而年龄、CEA水平、肿瘤沉积和神经侵犯等特征也具有重要贡献。值得注意的是,系统性治疗(主要为辅助化疗)在早发性结肠癌中显示出显著预后价值,这为临床治疗决策提供了量化依据。

风险分层与临床应用
基于60%和80%风险百分位数,OncoE25成功将患者分为低、中、高风险组,各组间生存差异显著(P<0.001)。如图例所示,高风险组患者B的5年CSS概率仅77.8%,显著低于低风险组患者A的98.4%。研究团队已将模型部署为在线工具(https://oncoe25.streamlit.app/),支持实时临床决策。

讨论与意义
这项研究首次建立了针对EOCRC亚型的专属预后模型,其创新性体现在三个方面:一是通过人工智能捕捉了传统统计方法难以识别的非线性关系和特征交互作用;二是严格区分结肠癌与直肠癌的建模策略提高了预测准确性;三是中国队列的外部验证证实了模型的跨人群适用性。尽管存在SEER数据缺乏分子标志物等局限,OncoE25仍为年轻CRC患者的精准医疗提供了重要工具。未来研究可整合多组学数据,并探索模型在辅助化疗获益人群筛选中的应用价值。

研究结果发表于《Journal of Translational Medicine》,标志着人工智能在肿瘤预后预测领域的重要突破。该模型不仅弥补了EOCRC临床管理的空白,其方法论框架也可拓展至其他癌症类型的预后研究,具有广泛的转化医学意义。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号