基于机器学习与血浆外泌体RNA特征的消化系统癌症诊断模型构建及生物标志物发现

【字体: 时间:2025年09月08日 来源:Computational and Structural Biotechnology Journal 4.1

编辑推荐:

  本文推荐:研究团队通过整合exoRBase 2.0数据库中的血浆外泌体(PDEV)RNA测序数据,采用XGBoost等10种机器学习算法构建消化系统癌症(DSCs)诊断模型,筛选出BANK1、MALAT1等9个外泌体mRNA/lncRNA标志物,模型训练集AUC达0.83,测试集提升至0.94,为DSCs早期无创诊断提供新策略。

  

亮点

数据收集与预处理

exoRBase 2.0作为综合性外泌体RNA测序数据库,整合了血液、尿液等多种体液的细胞外囊泡(EVs)数据。本研究从中获取444例样本(326例DSCs患者和118例健康人),按8:2比例划分为训练集与测试集,涵盖胃癌(GC)、肝细胞癌(HCC)等五种消化系统癌症类型。

预测因子筛选

图S1展示了研究流程:训练集通过LASSO回归、随机森林(RF)等算法从114,602个RNA中筛选特征,最终锁定BANK1、MALAT1等9个外泌体RNA标志物。XGBoost模型表现最优,训练集AUC 0.83,测试集跃升至0.94,显著超越传统血清标志物CEA/CA199

讨论

传统血清标志物如CA724对早期DSCs灵敏度不足,而外泌体因膜结构保护使其RNA更稳定。本研究首次建立基于PDEV的多癌种诊断模型,其中MALAT1(致癌lncRNA)和FGB(凝血因子)等分子与肿瘤微环境(TME)重塑密切相关,暗示其生物学机制值得深入探索。

结论

机器学习驱动的PDEV诊断模型展现出卓越临床潜力,9种外泌体RNA组合可作为DSCs"液体活检"新工具,但需进一步验证其分子机制。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号