编辑推荐:
为解决当前对植物长距离 mRNA 通讯认知中存在的问题,研究人员开展了对现有移动 mRNA 数据集的荟萃分析及相关生物信息学流程的研究。结果发现当前注释的嫁接移动转录本中,很大比例缺乏 RNA-seq 数据的统计支持,挑战了以往观点,为深入理解 mRNA 通讯提供新视角。
在植物的世界里,细胞之间的通讯就像一场神秘的对话,而 mRNA 作为信息传递的 “小使者”,一直备受关注。早期基于短读 RNA 测序(RNA-seq)对嫁接植物的研究提出,数千种信使核糖核酸(mRNA)能在植物组织间长距离移动,这一发现就像在平静的湖面上投下了一颗巨石,激起了层层涟漪。因为 mRNA 在细胞和组织间的运输被认为在植物的许多生理和发育过程中扮演着重要角色,比如块茎形成、叶片发育和分生组织维持等。但尴尬的是,对于大多数移动 mRNA 来说,它们运输的生物学相关性却一直模糊不清,就像蒙着一层神秘的面纱。
为了揭开这层面纱,来自英国约翰英纳斯中心(John Innes Centre)、美国康奈尔大学(Cornell University)等多个研究机构的研究人员,踏上了探索之旅。他们开展了对现有移动 mRNA 数据集的荟萃分析(meta-analysis),并仔细审视了相关生物信息学流程,力求找出那些被误判的 “小使者”。
研究人员发现,目前关于移动 mRNA 研究的关键步骤 —— 将 RNA-seq 读数分配到不同基因型,存在诸多问题。在识别基因型时,常用的基于单核苷酸多态性(Single Nucleotide Polymorphisms,SNP)的方法,会受到测序噪声的严重影响。Illumina 测序机器存在碱基识别错误,而且在测序前,逆转录酶也可能引入碱基变化。这些错误就像隐藏在黑暗中的 “捣蛋鬼”,干扰着研究人员对移动 mRNA 的判断。研究表明,很多之前被认定为移动的 mRNA,其证据可能仅仅源于测序噪声。例如,在特定的 SNP 识别准确率下,大量先前鉴定的移动 mRNA 的读数情况与测序噪声预期相符。
除了技术问题,生物学因素也来 “捣乱”。基因拷贝数变异等会导致读数映射错误,产生假 SNP 和假杂合性,让研究人员误以为发现了移动 mRNA。研究人员还发现,不同实验之间的重叠性较差,密切相关物种中的直系同源物在移动性上也存在冲突,这都表明目前对移动 mRNA 数量的认知可能存在偏差。
此外,对于跨物种研究中不依赖 SNP 的方法,也面临着基因组组装质量和读数深度的挑战。比如,在研究本氏烟草(Nicotiana benthamiana)和番茄(Solanum lycopersicum)之间的 mRNA 移动时,由于基因组组装不完全,很多读数的映射存在问题,难以准确判断 mRNA 的来源。
总的来说,这项研究对之前报道的移动 mRNA 数量提出了质疑。虽然有少量 mRNA 长距离移动的证据确凿,但从已验证的少数案例外推到大量潜在的长距离信号分子,这一做法受到了挑战。该研究成果发表在《Nature Plants》上,为植物 mRNA 通讯领域的研究指明了新方向,让研究人员更加谨慎地对待之前的研究结论,重新审视实验方法,以获得更准确的认知。
在研究过程中,研究人员主要用到了以下关键技术方法:利用 hisat2 将原始读数映射到参考基因组,并用 samtools 进行处理;使用 Stringtie 对表达水平进行量化;借助 bcftools 对原始核苷酸计数进行量化;通过 blast + 在 NCBI 核苷酸数据库中进行比对搜索;运用精确贝叶斯推断等统计学方法评估移动 mRNA 检测的准确性。
下面来看具体的研究结果:
- 测序噪声影响移动 mRNA 的识别:研究人员通过分析发现,许多报道的移动 mRNA 的读数与测序噪声预期相符。以拟南芥(Arabidopsis thaliana)和格氏葡萄(Vitis girdiana)的相关数据为例,在特定 SNP 识别准确率下,大量先前鉴定的移动 mRNA 的证据与测序噪声一致。而且,当考虑多个 SNP 时,仍存在一些不一致的判断,这进一步表明测序噪声会干扰移动 mRNA 的识别。
- 生物学因素导致假阳性:研究发现拟南芥 Ped-0 生态型中存在一些基因的假杂合性,这可能是由基因拷贝数变异等生物学因素引起的。这些假杂合性会导致读数映射错误,产生假 SNP,从而使一些转录本被错误地认定为移动 mRNA。
- 跨物种研究面临挑战:在跨物种研究中,基因组组装质量和读数深度会影响 RNA-seq 数据的解读。如研究本氏烟草和番茄之间的 mRNA 移动时,由于番茄基因组部分未组装,导致很多读数映射到本氏烟草基因组的小区域,且外显子覆盖不均,还存在大量与保守序列匹配的情况,难以准确判断 mRNA 的来源。
在研究结论和讨论部分,研究人员强调了研究成果的重要意义。他们指出目前对移动 mRNA 数量的认知可能存在较大偏差,以往基于 RNA-seq 研究报道的数千种移动转录本,可能存在大量误判。这一发现挑战了当前对 mRNA 通讯的认知,提醒研究人员在后续研究中要更加严谨地设计实验、分析数据,避免假阳性结果。同时,研究人员还提出了一系列建议,如利用基因组映射可视化工具检查假杂合性和污染、考虑共现 SNP、评估实验和计算程序的准确性、进行独立生物学重复实验等,为未来的研究提供了重要参考,有助于推动植物 mRNA 通讯领域的深入发展。