急性髓系白血病中全面的lincRNA转录组:整合儿童和成人队列中已知和新鉴定的lincRNAs

《Non-Coding RNA》:Comprehensive lincRNA Transcriptome in Acute Myeloid Leukemia: Integrating Known and Newly Identified lincRNAs Across Pediatric and Adult Cohorts

【字体: 时间:2026年06月10日 来源:Non-Coding RNA 3

编辑推荐:

  背景/目的:急性髓系白血病(Acute Myeloid Leukemia, AML)包含具有不同基因表达谱的遗传亚类。虽然AML基因表达研究主要关注蛋白质编码基因,但研究人员对长基因间非编码RNA(long intergenic noncoding RNA,

  
背景/目的:急性髓系白血病(Acute Myeloid Leukemia, AML)包含具有不同基因表达谱的遗传亚类。虽然AML基因表达研究主要关注蛋白质编码基因,但研究人员对长基因间非编码RNA(long intergenic noncoding RNA, lincRNA)表达模式的理解仍不完整。这归因于有限的样本量,以及具有情境依赖性表达的lncRNA注释不完善。方法:为弥补这一空白,研究人员开发了生物信息学流程LIRA(long intergenic noncoding RNA annotator),使用严格标准(包括剪接和基因间转录本)以及排除编码潜能的算法来鉴定新型lincRNA。结果:将LIRA应用于来自878例儿童和成人AML病例以及20例健康对照的RNA测序数据,研究人员鉴定出1560个新型lincRNA,使GENCODE v38的lincRNA目录扩充了27%。整合内部生成的来自KMT2A::MLLT3样本的CAGE和ChIP测序数据显示,80%的新型lincRNA具有5′帽结构,至少67%在其转录起始位点携带激活型表观遗传标记。对1000个表达最可变的已知和新型lincRNA进行无监督分析,揭示了亚类特异性的表达模式,与蛋白质编码基因观察到的模式相似。加权基因共表达网络分析(Weighted Gene Co-expression Network Analysis, WGCNA)鉴定出17个与AML亚类相关的lincRNA表达模块。值得注意的是,在降解致白血病癌融合蛋白KMT2A::MLLT3和PML::RARA后,这些模块的表达下降,表明lincRNA表达对致癌信号具有响应性。结论:这项全面分析表明,lincRNA展现出与蛋白质编码基因相似的亚类特异性表达模式,为未来针对遗传定义的AML亚类的研究建立了宝贵资源,并对生物标志物发现和靶向治疗具有潜在意义。
**论文解读:《Non-Coding RNA》发表的急性髓系白血病lincRNA转录组综合研究**

**研究背景、问题与目的**
急性髓系白血病(Acute Myeloid Leukemia, AML)是一种遗传异质性疾病,其亚类由特定遗传异常(如染色体易位和基因突变)定义。既往研究已通过蛋白质编码基因的表达谱对AML进行分型,但对长基因间非编码RNA(long intergenic noncoding RNA, lincRNA)在AML中的表达模式认识不足。lincRNA虽在基因表达调控、代谢和信号转导中发挥关键作用,但因其组织特异性表达及注释不完整,尤其是在疾病背景下,大规模系统性鉴定尚属空白。现有lncRNA数据库多基于健康组织,缺乏对白血病特异性lincRNA的收录。为此,研究人员开发了生物信息学流程LIRA(Long Intergenic Noncoding RNA Annotator),旨在从大规模患者队列中识别新型lincRNA,并全面解析lincRNA转录组与遗传定义的AML亚类之间的关联,为生物标志物发现和靶向治疗提供资源。

**主要关键技术方法**
研究人员使用了来自四个独立队列的878例AML样本(包括儿童AML-05队列、TARGET队列、成人BEAT队列和TCGA-LAML队列)以及20例健康对照样本(其中19例为健康骨髓,1例为健康CD34+细胞)。采用STAR进行参考基因组比对,StringTie进行从头转录本组装。随后通过排除已知注释转录本(Ensembl、GENCODE、LNCipedia、RefSeq)、筛选剪接、基因间位置、长度>200核苷酸,并利用CPAT和PLEK算法评估编码潜能,最终鉴定出1560个新型lincRNA。此外,利用内部生成的KMT2A::MLLT3样本的CAGE-seq(Cap Analysis of Gene Expression)、ChIP-seq数据及BLUEPRINT联盟的表观遗传标记数据验证新型lincRNA的特征。使用Combat-seq进行批次校正,DESeq2进行标准化,UMAP进行降维聚类,WGCNA(加权基因共表达网络分析)构建共表达模块。针对KMT2A::MLLT3和PML::RARA癌融合蛋白的降解实验(PROTAC、DOT1L抑制剂、MENIN抑制剂及ATRA处理)采用公开RNA-seq数据集分析lincRNA表达变化。

**研究结果**

**2.1 长基因间非编码RNA注释器(LIRA)鉴定出1560个此前未注释的lincRNA**
通过对898个样本(878例AML、19例健康骨髓和1例健康CD34+)的RNA-seq数据进行LIRA流程分析,经严格过滤(排除与已知基因重叠、非剪接、长度<200 nt、具编码潜能的转录本),研究人员鉴定出1560个新型lincRNA(命名LIRA1–1560)。这些lincRNA分布于全基因组,在染色体13、14、15的短臂及Y染色体长臂基因贫乏区域存在缺失。与蛋白质编码转录本相比,新型lincRNA外显子更少、长度更短。

**2.2 新型lincRNA具有5′帽结构且转录起始位点含转录相关表观遗传标记**
在KMT2A::MLLT3 AML样本中,RNA-seq显示220个新型lincRNA表达。CAGE-seq分析表明80%与单向转录起始位点(Transcription Start Site, TSS)重叠,其中67%还至少与一种活性组蛋白标记(H3K4me3、H3K4me1、H3K27ac)重叠。IGV可视化展示了个别lincRNA的替代TSS、可变剪接及双链表达特征,证实新型lincRNA与已知lincRNA具有相似特征。

**2.3 lincRNA在遗传定义的AML亚类中展示出独特表达模式**
对878例AML和19例健康骨髓样本进行批次校正后,基于1000个最可变蛋白质编码转录本和1000个最可变新型lincRNA分别进行UMAP分析,结果显示遗传亚类(如CBFB::MYH11、PML::RARA、KMT2A::MLLT3、RUNX1::RUNX1T1、NPM1突变等)在两组数据中均形成明显聚类。整合已知(79%)和新型(21%)lincRNA后,基于1000个最可变lincRNA(其中35%为新型)的UMAP同样重现亚类特异性分组,表明lincRNA表达谱强烈反映AML遗传背景。

**2.4 lincRNA共表达模块与遗传定义的AML亚类相关**
对1000个最可变lincRNA进行WGCNA,鉴定出17个共表达模块(大小10–183个基因,新型lincRNA占比13–92%)及1个剩余模块。每个模块至少与三个遗传亚类或健康骨髓呈显著正相关(红色)或负相关(蓝色)。例如,模块8和10与KMT2A重排(KMT2A-R)强正相关,模块2和7与PML::RARA强正相关。模块中包含32个既往已报道参与正常及恶性造血的已知lincRNA(如CRNDE、PCAT18、LINC01257)。

**2.5 亚类特异性lincRNA表达在KMT2A::MLLT3和PML::RARA降解后减弱**
在KMT2A::MLLT3永生化脐血CD34+细胞中,PROTAC介导的癌融合蛋白降解导致模块8和10表达显著下降;DOT1L抑制剂(EPZ-5676)和MENIN抑制剂(VTP-50469)单用或联用同样降低这些模块表达,且联用效果更强。在PML::RARA阳性患者骨髓样本中,ATRA(全反式维甲酸)处理(20–24小时)导致模块2和7表达呈下降趋势,表明lincRNA模块表达受癌融合蛋白活性调控。

**2.6 儿童与成人AML之间lincRNA共表达模块的差异**
针对儿童和成人共享的遗传亚类(CEBPA突变、FLT3-ITD、CBFB::MYH11、RUNX1::RUNX1T1、KMT2A重排)进行WGCNA,鉴定出20个模块。约50%的模块—亚类相关性在儿童和成人中一致,但部分模块在同亚类的儿童与成人间存在显著表达差异,提示亚类驱动的lincRNA表达模式总体保守,但表达水平可能因年龄而异。

**讨论与结论总结**
讨论部分指出,此前研究多关注健康组织中的lincRNA,本研究通过LIRA在898个样本中鉴定1560个新型lincRNA,使已知lincRNA数量增加27%。这些新型lincRNA部分反映了AML相关转录失调,部分为低表达或特定细胞类型/发育阶段未注释的普遍表达转录本。GENCODE v47中已出现590个与本研究相同的新型lincRNA,验证了LIRA的可靠性。由于LIRA刻意聚焦于剪接的基因间lincRNA,因此排除了基因重叠(正义或反义)及内含子lncRNA(如ANRIL、RUNXOR、IRAIN、HOTAIRM1),但长读长RNA-seq未来可能更可靠地鉴定这类转录本。基于大样本量,研究呈现了迄今最全面的AML lincRNA表达谱,无监督UMAP分析显示lincRNA与蛋白质编码基因类似,均能根据遗传亚类紧密聚类。WGCNA鉴定的17个模块(共含755个lincRNA)与各亚类相关,其中32个lincRNA已有白血病关联报道(如CRNDE在PML::RARA中过表达,PCAT18在NPM1突变中加速细胞周期,LINC01257在RUNX1::RUNX1T1儿童AML中为潜在治疗靶点)。癌融合蛋白降解实验表明高模块表达是KMT2A::MLLT3和PML::RARA的下游效应。未来需确定单个lincRNA是否直接受癌融合蛋白激活,并进一步研究其在AML中的功能及作为生物标志物和治疗靶点的潜力。

**研究结论翻译**:本研究提出了LIRA(长基因间非编码RNA注释器),一个免费可用的用于鉴定新型lincRNA的流程。利用LIRA,研究人员将AML中已注释的lincRNA谱系扩充了27%。对898例AML和健康样本的全面分析揭示,与蛋白质编码基因类似,lincRNA表达模式紧密反映已建立的遗传AML亚类。加权基因共表达网络分析发现了与这些亚类相关的模块。总之,该工作为功能研究提供了资源,促进了对lincRNA作为生物标志物和治疗靶点的探索,最终目标是改善AML患者的预后。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号