编辑推荐:
为探究长链非编码 RNA(lncRNAs)在毕赤酵母(Komagataella phaffii)适应近零生长条件中的作用,研究人员分析其 RNA-Seq 数据。结果识别出 168 个 lncRNAs,36 个与生长速率相关,且其在调控适应中可能有潜在作用,为优化工业生物过程提供参考。
在生命科学的微观世界里,长链非编码 RNA(lncRNAs)宛如神秘的精灵,虽不编码蛋白质,却在众多细胞过程中施展着关键魔法。近年来,随着研究的深入,lncRNAs 在真核生物中的多样作用逐渐崭露头角,在酵母这类单细胞生物的研究中也取得了不少进展。不过,在工业生产中常用的非传统酵母 —— 毕赤酵母(
Komagataella phaffii)里,lncRNAs 却像是被隐藏在迷雾之中,有待进一步探索。
此前,虽有研究尝试对毕赤酵母的 lncRNAs 进行注释,但都存在局限性。比如,Schneider 团队受 RNAseq 数据文库制备方法的限制,对反义 lncRNAs 的注释不够准确;Sun 团队虽标注了较多 lncRNAs 并发现其与碳源相关的调控反应,但相关信息并不全面。同时,细胞在适应如近零生长这般的极端环境时,lncRNAs 是否参与其中、发挥何种作用,这些问题都悬而未决。正是在这样的背景下,为了揭开毕赤酵母中 lncRNAs 的神秘面纱,探索它们在细胞应对近零生长环境时的潜在作用,研究人员踏上了这场充满挑战的科研之旅。
研究人员利用从毕赤酵母葡萄糖限制恒化器培养实验中获得的 RNA-Seq 数据,开展了一系列深入研究。该研究成果发表在《Computational and Structural Biotechnology Journal》上,为我们理解毕赤酵母的生长调控机制带来了新曙光。
在研究过程中,研究人员运用了多种关键技术方法。首先,对 RNA-Seq 数据进行预处理,去除低质量碱基和污染的接头序列。接着,利用 STAR 软件将处理后的序列比对到 CBS7435 参考基因组,并使用 StringTie 进行转录组组装。之后,通过 FEELnc、RNASamba 等多种工具对转录本进行筛选和分类,以识别 lncRNAs。同时,借助 DESeq2 进行差异基因表达分析,还利用 Mfuzz 和 MPLNclust 等方法对基因进行聚类分析,探究基因间的关系 。
下面让我们详细看看研究的具体成果:
- 长链非编码 RNA 的识别:研究人员开发了一套针对毕赤酵母的 lncRNA 注释流程,从不同生长速率下的 RNA-Seq 数据中识别出 168 个 lncRNAs,其中 13 个为多外显子 lncRNA。这些 lncRNAs 在基因组中广泛分布,且具有与编码基因相似的 GC 含量和长度,但表达水平较低。
- lncRNA 表达与生长速率的关系:通过主成分分析和层次聚类分析发现,生长速率是影响 lncRNA 表达差异的主要因素。在 168 个 lncRNA 基因中,有 36 个表现出显著的生长速率依赖性表达变化。随着细胞生长速率的减慢,差异表达的 lncRNAs 数量增多。
- lncRNA 的功能预测:研究人员通过聚类分析发现,lncRNAs 与参与多种细胞过程的基因共表达,暗示其在这些过程中的潜在作用。对于顺式(cis)作用的 lncRNAs,通过分析其与邻近基因的表达相关性,发现部分 lncRNAs 与邻近基因表达呈正相关或负相关 。对于反式(trans)作用的 lncRNAs,利用 Triplexator 预测其与编码基因形成 RNA-DNA 三链体(triplex)的潜在相互作用,发现许多 lncRNAs 可能通过这种方式调控编码基因的表达。
在讨论部分,研究人员对发现的 lncRNAs 特征进行了深入探讨。与其他酵母的 lncRNAs 相比,毕赤酵母的 lncRNAs 在 GC 含量、长度和表达水平上有其独特之处。同时,与之前研究报道的 lncRNAs 重叠较少,这可能与实验条件、测序技术和参考注释的差异有关。
从功能角度来看,研究发现一些 lncRNAs 与甲醇利用、细胞周期调控、脂质代谢等过程相关基因邻近或相互作用,暗示它们在这些过程中发挥着潜在的调控作用。例如,MSTRG.3443 与AGP2-2基因反义,且二者表达呈负相关,推测其可能参与调控转运蛋白基因的表达,影响细胞的代谢重编程。
总的来说,这项研究在毕赤酵母 lncRNAs 的探索上取得了重要突破。不仅识别出大量 lncRNAs 并揭示了它们与生长速率的紧密联系,还为理解 lncRNAs 在毕赤酵母应对近零生长等挑战性环境中的作用提供了关键线索。这一成果有助于我们进一步阐明非传统酵母的基因表达调控机制,为优化工业生物过程、提高生产效率奠定了理论基础,也为后续深入研究 lncRNAs 在其他生物中的功能提供了有价值的参考。