
-
生物通官微
陪你抓住生命科技
跳动的脉搏
机器学习鉴定外周血6基因标志物:胰腺癌无创诊断新突破
【字体: 大 中 小 】 时间:2025年06月12日 来源:Heliyon 3.4
编辑推荐:
胰腺导管腺癌(PDAC)早期诊断困难导致预后极差,本研究通过机器学习分析外周血单核细胞(PBMC)和细胞外囊泡长RNA(exLR)测序数据,筛选出具有生物学意义的6基因标志物(TXNIP/IL7R/CCL4/PTPRC/HP/CD27),在交叉验证中实现71%的F1-score,为PDAC与慢性胰腺炎(CP)的无创鉴别提供了新工具。
胰腺癌被称为"癌中之王",其中胰腺导管腺癌(PDAC)五年生存率不足10%,这种残酷现实背后是早期诊断的困境。由于缺乏特异性症状,超过80%患者确诊时已失去手术机会。更棘手的是,慢性胰腺炎(CP)患者不仅PDAC风险增加10倍,两种疾病在影像学表现上还经常"真假难辨"。传统组织活检虽为金标准,但存在创伤大、取样偏差等问题,而临床常用的CA19-9标志物又面临特异性不足的挑战。这些难题催生了对新型无创诊断方法的迫切需求。
Virgen de las Nieves大学医院的研究团队另辟蹊径,将目光投向外周血中的信息宝藏。他们创新性地整合两种血液组分——反映细胞外信息的exLR和代表细胞内RNA的PBMC数据,通过机器学习挖掘出能区分PDAC、CP和健康人群的基因特征。这项发表在《Heliyon》的研究最终鉴定出6个具有明确生物学功能的基因标志物,为胰腺疾病的无创诊断提供了新思路。
研究采用多组学技术路线:首先从GEO数据库获取284例PDAC、100例CP和117例对照的exLR数据(GSE133684),同时收集72例本地PBMC样本(25 PDAC/22 CP/25对照)。通过mRMR算法筛选特征基因后,比较了XGBoost、kNN、SVM和随机森林等模型的分类性能。最优模型在5折交叉验证中评估,最终通过基因集富集分析(GSEA)解析生物学通路。
"机器学习筛选15基因标志物可准确区分PDAC和CP"部分显示,基于exLR数据建立的15基因标志物在PBMC验证集中保持80%的F1-score,显著优于随机基因组合(p<0.01)。其中硫氧还蛋白结合蛋白TXNIP在胰腺疾病组显著高表达,与已知的葡萄糖代谢调控功能相符;而白细胞介素7受体IL7R在PDAC组明显下调,反映了肿瘤免疫微环境的特征性改变。
"PDAC和CP检测的6基因生物标志物"章节报道了更具临床转化价值的精简版标志物。这6个基因涉及免疫调节(IL7R/CD27)、炎症反应(CCL4/HP)和细胞信号(PTPRC)等多条通路,在留一法验证中达到71%的F1-score。特别值得注意的是,触珠蛋白HP的表达模式与PDAC特征性糖基化修饰研究相呼应,而CD27的下调则解释了肿瘤免疫逃逸的部分机制。这些发现不仅具有诊断价值,还为理解PDAC发病机制提供了新视角。
讨论部分深入剖析了标志物的生物学意义。TXNIP的高表达既关联胰腺β细胞葡萄糖感应,又与肿瘤相关巨噬细胞标记物ARG1/ACLY存在共表达;CCL4的双向调控作用则揭示了其在胰腺炎症向癌症转化中的复杂角色。与CA19-9相比,该标志物特异性提高7.4个百分点,且能同步鉴别CP状态。研究者也坦承样本量有限、缺乏吸烟饮酒等协变量信息的局限性,建议未来在更多中心验证。
这项研究的突破性在于:首次证明血液RNA标志物可跨平台(exLR→PBMC)稳定应用;创新的"机器学习驱动+生物学验证"双筛选模式;6基因panel兼顾性能与临床实用性。不仅为PDAC早诊提供了新型液体活检工具,其揭示的免疫相关基因变化更为开发联合诊断-治疗策略指明了方向。随着精准医学发展,这种基于外周血的"分子听诊器"或将成为攻克胰腺癌诊断难题的重要突破口。
生物通微信公众号
知名企业招聘