编辑推荐:
为解决垫柳基因组存在未组装重复序列、基因表达图谱有限的问题,研究人员开展了垫柳基因组和转录组研究。他们更新了垫柳基因组,获得高质量转录组图谱,为相关研究提供参考,推动柳树遗传改良等应用。
在神秘的高山之上,有一种植物顽强地生长在恶劣环境中,它就是垫柳(Salix brachista)。柳树家族在北半球广泛分布,有着重要的经济价值,比如用于观赏、生物质生产等。而垫柳作为高山植物,不仅有着独特的生长形态,多为垫状,茎匍匐且侧枝繁多,高度通常不超过 5 厘米 ,还具备特殊的性别系统,既有雌雄异株,也发现过雌雄同株的情况,这让它成为研究植物性别决定演化的绝佳对象。同时,高山地区环境极为恶劣,强辐射、大风、低温、缺氧等,垫柳在这样的环境中生存,其基因组里必定积累了大量应对胁迫的基因,对于挖掘高山植物抗逆基因资源意义重大。
然而,此前垫柳的研究却面临诸多困境。其已报道的基因组存在不少问题,像端粒、5S rDNA 等重复序列都还未成功组装,基因表达图谱也十分有限,这就如同拼图缺了关键部分,严重阻碍了对垫柳潜在价值的深入挖掘和利用,无论是在柳树作为生物能源作物的遗传改良方面,还是在园艺观赏应用上,都受到了极大限制。
为了突破这些困境,中国科学院昆明植物研究所的研究人员勇挑重担,开展了一项意义非凡的研究。他们成功更新了垫柳的基因组,使其达到单倍型解析且近乎端粒到端粒的高质量水平,同时还绘制出了高精度的转录组图谱。这一成果意义重大,为高山植物适应性研究、植物性别决定演化研究提供了全新的潜在模式物种,也为柳树作物的改良指明了方向,相关研究成果发表在《Scientific Data》杂志上。
在研究过程中,研究人员运用了多种关键技术方法。首先是样本采集,他们从云南香格里拉天宝山采集了垫柳的新鲜幼叶用于提取基因组 DNA,还采集了根、茎、叶、花等七个不同器官的 RNA 。在测序环节,采用了 PacBio Revio System 进行环形一致性序列测序、Illumina 高通量染色体构象捕获测序(Hi-C)、Illumina 高通量 RNA 测序以及 Nanopore 全长转录组测序技术。通过这些技术,获取了大量数据,为后续深入分析奠定基础。
下面来看具体的研究结果:
- 基因组组装:研究人员借助 PacBio 单分子实时长读长序列、Hi-C 序列和 Illumina 短读长序列进行基因组组装。最终成功组装出 38 条染色体,分为单倍型 A 和单倍型 B,与之前核型分析结果(2n=38)一致。单倍型 A 基因组大小为 401.5 Mb,contig N50 长度达 22.6 Mb;单倍型 B 基因组大小是 386.2 Mb,contig N50 长度为 21.8 Mb 。经过一系列复杂的处理和分析,还完成了叶绿体和线粒体基因组的组装,其大小分别为 155,612 bp 和 630,081 bp。
- 基因识别与功能注释:为了全面了解垫柳基因信息,研究人员做了大量细致的工作。他们整合了 17 种杨柳科植物及拟南芥(Arabidopsis thaliana)的同源蛋白序列,结合 ONT 转录组数据和 Illumina RNA-seq 数据,构建了用于注释的数据集。通过一系列软件和方法,识别出 53,238 个蛋白质编码基因、1,414 个 rRNA、1,301 个 tRNA 和 1,216 个 ncRNA 。还运用多种数据库和工具,对基因功能和结构特征进行注释,明确了基因在不同代谢途径和生物学过程中的作用。
- 等位基因识别与表达分析:利用 AlleleFinder 管道,基于相似性和共线性策略,研究人员识别出 23,744 个等位基因,其中包括 1,459 个旁系同源基因和 647 个串联基因 。通过对成熟叶 RNA-seq 数据的分析,计算出片段每千碱基百万映射 reads 外显子模型(FPKM)值,以此来展示等位基因的表达水平。
- 转录本比对与组装:对 RNA-seq 原始数据进行严格处理,去除接头和低质量 reads 。利用 HISAT2 将数据与参考基因组比对,再通过 SAMtools 和 Stringtie2 软件,从七个器官中成功组装出 28,587 个非冗余转录本。通过计算基因的 FPKM 值,筛选出不同表达水平的基因,如高表达基因(FPKM>20)、器官特异性表达基因等。还使用 R 包 DESeq2 鉴定出差异表达基因(DEGs) ,并进行 GO 和 KEGG 富集分析,探究不同表达水平基因的功能和参与的代谢途径。
- 可变剪接(AS)事件和可变多聚腺苷酸化(APA)位点鉴定:基于 ONT 全长转录组数据和单倍型 A 基因组,研究人员运用特定软件和脚本,成功鉴定出 33,414 个 AS 事件,涵盖跳过外显子(SE)、互斥外显子(MX)等七种类型;还识别出 36,634 个 APA 位点,这些位点在基因表达调控机制研究中至关重要。
综合来看,研究人员成功绘制出垫柳高质量的基因组和转录组图谱,为深入研究垫柳的遗传特性、适应高山环境的分子机制以及性别决定演化提供了丰富的数据资源和理论依据。这不仅有助于我们更好地理解高山植物的奥秘,还为柳树作物的遗传改良开辟了新道路,在生命科学领域有着重要的理论和实践意义,为后续相关研究指明了方向,推动了植物学研究的进一步发展。