
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习与血浆外泌体RNA特征的消化系统癌症诊断模型构建及生物标志物发现
【字体: 大 中 小 】 时间:2025年09月08日 来源:Computational and Structural Biotechnology Journal 4.1
编辑推荐:
本文推荐:研究团队通过整合exoRBase 2.0数据库中的血浆外泌体(PDEV)RNA测序数据,采用XGBoost等10种机器学习算法构建消化系统癌症(DSCs)诊断模型,筛选出BANK1、MALAT1等9个外泌体mRNA/lncRNA标志物,模型训练集AUC达0.83,测试集提升至0.94,为DSCs早期无创诊断提供新策略。
亮点
数据收集与预处理
exoRBase 2.0作为综合性外泌体RNA测序数据库,整合了血液、尿液等多种体液的细胞外囊泡(EVs)数据。本研究从中获取444例样本(326例DSCs患者和118例健康人),按8:2比例划分为训练集与测试集,涵盖胃癌(GC)、肝细胞癌(HCC)等五种消化系统癌症类型。
预测因子筛选
图S1展示了研究流程:训练集通过LASSO回归、随机森林(RF)等算法从114,602个RNA中筛选特征,最终锁定BANK1、MALAT1等9个外泌体RNA标志物。XGBoost模型表现最优,训练集AUC 0.83,测试集跃升至0.94,显著超越传统血清标志物CEA/CA199。
讨论
传统血清标志物如CA724对早期DSCs灵敏度不足,而外泌体因膜结构保护使其RNA更稳定。本研究首次建立基于PDEV的多癌种诊断模型,其中MALAT1(致癌lncRNA)和FGB(凝血因子)等分子与肿瘤微环境(TME)重塑密切相关,暗示其生物学机制值得深入探索。
结论
机器学习驱动的PDEV诊断模型展现出卓越临床潜力,9种外泌体RNA组合可作为DSCs"液体活检"新工具,但需进一步验证其分子机制。
生物通微信公众号
知名企业招聘