基于基因表达相对排序的弥漫性大B细胞淋巴瘤GCB亚型定性转录标志物开发及验证

《Annals of Hematology》:Integrating bulk and single-cell transcriptome to identify novel gene markers for germinal center B cells (GCB) subtype of diffuse large B-cell lymphoma

【字体: 时间:2025年10月23日 来源:Annals of Hematology 2.4

编辑推荐:

  本研究针对弥漫性大B细胞淋巴瘤(DLBCL)细胞起源(COO)分型临床应用的局限性,开发了基于基因相对表达排序(REO)的19基因对定性标志物(19-GPS)。该标志物在四个独立数据集(1504例样本)中验证准确率达84.34%-92.72%,较金标准分型显示更优预后分层能力。研究发现HMCES、ZFAND4和NLRP4三个GCB标志基因与R-CHOP疗效相关,为DLBCL精准诊疗提供新策略。

  
弥漫性大B细胞淋巴瘤(DLBCL)作为非霍奇金淋巴瘤中最常见的亚型,其临床异质性强且侵袭性高。通过基因表达谱(GEP)分析,DLBCL可分为生发中心B细胞样(GCB)、活化B细胞样(ABC)和未分类型(UC)三种细胞起源(COO)亚型。其中GCB亚型患者在接受R-CHOP方案治疗时预后显著优于非GCB亚型,因此准确区分GCB与非GCB亚型对临床预后判断和治疗决策具有重要意义。然而,当前金标准分型方法(如Wright算法)存在批次效应敏感、需大样本标准化等问题,而商业化检测平台Lymph2Cx也存在约11%的样本无法分类等技术局限,限制了其临床应用。
为解决这一难题,Chen Huxing等研究人员创新性地利用基因相对表达排序(REO)稳定性高、抗批次效应强的特点,开展了整合 bulk 和单细胞转录组识别GCB亚型新型标志物的研究。该研究通过分析5个训练数据集(381例样本)的基因表达数据,筛选出在GCB与非GCB亚型间具有反转REO模式的基因对,最终开发出包含19个基因对的定性转录标志物(19-GPS)。该标志物仅需检测样本内基因对的相对表达顺序即可完成分型,在四个独立验证数据集(1504例样本)中表现出84.34%-92.72%的准确率,且预后分层能力优于传统金标准方法。
研究团队主要采用生物信息学分析方法,包括:从GEO和TCGA数据库获取DLBCL基因表达数据;基于二项检验识别稳定REO基因对;通过前向逐步选择算法优化标志物组合;利用Kaplan-Meier生存分析和Cox回归模型评估预后价值;结合单细胞RNA测序数据(GSE182434)进行细胞类型特异性表达解析;采用STRING数据库进行蛋白质互作网络分析。样本来源涵盖1006例新鲜冷冻组织和498例福尔马林固定石蜡包埋组织。
开发与验证REO基础转录标志物
研究人员首先在训练集中识别出在GCB和非GCB亚型中具有显著稳定REO模式的基因对,进而筛选出1,977,878个(微阵列数据)和1,751,289个(RNA-seq数据)具有反转REO模式的基因对。通过F-score>0.75的严格筛选,最终确定19个基因对构成19-GPS标志物。该标志物采用多数投票原则进行分类:当至少10个基因对投票为GCB亚型时,样本被判定为GCB亚型。
验证结果显示,19-GPS在训练集中的准确率分别达到91.79%(微阵列样本)和90%(RNA-seq样本)。在独立验证集中,无论是基于微阵列平台(GSE10846和GSE31312)还是RNA-seq平台(GSE147986和NCICCR-DLBCL)的数据,19-GPS均保持高分类性能,准确率在84.34%-92.72%之间。特别值得注意的是,即使仅进行背景校正而不进行分位数标准化,19-GPS仍能保持稳定的分类效果,证明其对数据标准化方法不敏感。
19-GPS与金标准COO分类的预后意义比较
生存分析表明,基于19-GPS的COO分类在预后分层方面优于传统金标准。在训练集GSE23501中,19-GPS分类的GCB与非GCB患者的总生存(OS)和无进展生存(PFS)均呈现显著差异(OS:log-rank P=1.34×10-3;PFS:log-rank P=9.9×10-3)。在验证集中,19-GPS同样显示出更强的预后区分能力,特别是在R-CHOP治疗患者中。
引人注目的是,对于金标准定义为GCB但被19-GPS重新分类为非GCB的60例患者,其OS和PFS显著差于保持GCB分类的患者(OS:log-rank P=4.92×10-2,HR=1.6)。相反,金标准定义为非GCB但被19-GPS重新分类为GCB的62例患者,其OS和PFS显著优于保持非GCB分类的患者(OS:log-rank P=1.98×10-2,HR=1.76)。这表明19-GPS能够更精准地识别出真正具有良好预后的GCB亚型患者。
识别GCB亚型标志基因
通过对19-GPS中27个基因进行层次聚类分析,研究人员发现10个在GCB亚型中高表达的基因,其中包括已知的GCB标志基因LMO2、MYBL1、SERPINA9和MME,以及三个在DLBCL中研究较少的基因:HMCES、ZFAND4和NLRP4。
单细胞转录组分析揭示,NLRP4特异性表达于B淋巴细胞,ZFAND4在GCB-DLBCL的B淋巴细胞和T滤泡辅助细胞(Tfh)中高表达,而HMCES主要在GCB-DLBCL的自然杀伤(NK)细胞和CD4调节性T细胞中表达。值得注意的是,这三个基因在滤泡性淋巴瘤(FL)中的表达水平显著高于ABC-DLBCL,而FL与GCB-DLBCL同样起源于生发中心。
伪时间分析显示,FL样本中的B细胞具有向DLBCL分化的趋势,且在这一过程中NLRP4表达明显下降。在转化型FL中,NLRP4表达也低于普通FL样本,提示NLRP4可能参与FL向DLBCL的转化过程。
GCB标志基因HMCES、ZFAND4和NLRP4的预后价值
在R-CHOP治疗的DLBCL患者中,高表达HMCES、ZFAND4和NLRP4的患者组均显示出更好的OS和PFS。特别值得注意的是,在19-GPS分类的GCB亚型患者中,NLRP4高表达组的PFS仍显著优于低表达组,这一发现在多个验证数据集中得到重复验证,表明NLRP4对GCB亚型患者具有独立的预后价值。
HMCES、ZFAND4与药物反应的相关性分析
在人类恶性B细胞系中,这三个基因的表达与R-CHOP方案中药物的敏感性相关。在药物初治的B细胞癌细胞系面板中,HMCES表达与环磷酰胺和多柔比星的AUC0值呈负相关,而ZFAND4和NLRP4表达与三种药物(环磷酰胺、多柔比星、长春新碱)的AUC0值均呈负相关。
在多柔比星处理的细胞系中,NLRP4表达与药物反应水平呈负相关。在药物初治细胞系中,这三个基因在良好反应组中的表达水平高于不良反应组。有趣的是,HMCES和ZFAND4的药物反应模式与MS4A1(利妥昔单抗靶基因)相似,且在前治疗组织样本中,HMCES、ZFAND4与MS4A1表达呈显著正相关。
标志基因的PPI网络分析
蛋白质互作网络分析显示,19-GPS中的27个基因编码的蛋白质之间存在复杂的相互作用关系。对HMCES、ZFAND4和NLRP4的Top20互作蛋白进行k-means聚类分析发现,HMCES主要与rRNA加工、DNA修复和复制相关;ZFAND4主要参与翻译过程;而NLRP4则与I-kappaB激酶/NF-kappaB信号通路、自噬和细胞焦亡密切相关。这些生物学过程与多种化疗药物的作用机制相关。
本研究开发的19-GPS定性转录标志物为DLBCL的COO分型提供了一种稳定、可靠的新方法,克服了传统定量GEP方法的局限性。该标志物不仅具有较高的分类准确性,而且在预后分层方面优于金标准方法。研究发现HMCES、ZFAND4和NLRP4三个GCB标志基因与DLBCL的预后和药物反应相关,为理解GCB亚型DLBCL的生物学特性提供了新视角。这些发现对于DLBCL的精准分型、预后评估和治疗策略选择具有重要意义,有望在未来临床实践中发挥重要作用。尽管研究存在一定的局限性,如需要在前瞻性大样本中进一步验证,以及深入探索基因功能机制,但本研究无疑为DLBCL的精准医疗提供了有价值的工具和靶点。
该研究发表于《Annals of Hematology》,通过整合 bulk 和单细胞转录组数据,不仅开发了实用的临床分型工具,还深入揭示了GCB亚型DLBCL的分子特征,为这一重要淋巴瘤类型的精准诊疗奠定了坚实基础。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号