濒危植物辛氏平当树的单倍型无间隙染色体基因组组装及其保护与系统发育意义
《Scientific Data》:A haplotype-resolved gap-free chromosome assembly of the threatened plant Paradombeya sinensis
【字体:
大
中
小
】
时间:2025年12月21日
来源:Scientific Data 6.9
编辑推荐:
本研究针对濒危植物辛氏平当树基因组资源匮乏的问题,通过整合PacBio HiFi、ONT、Hi-C和RNA-seq等多组学数据,成功构建了高质量的单倍型无间隙染色体级别基因组。该组装大小为890 Mb,锚定至20条伪染色体,注释到68,639个基因,为阐明其系统发育争议(Paradombeya-Corchoropsis)、制定保护策略及挖掘抗旱基因提供了关键资源。
在中国西南部干热河谷的脆弱生态系统中,生长着一种具有重要生态和系统发育价值的特有树种——辛氏平当树(Paradombeya sinensis)。然而,由于人类活动的强烈干扰和其自身有限的种群规模,这种植物已被列为中国国家二级重点保护野生植物,处于濒危状态。更令人困惑的是,它在分类学上的地位一直存在争议。近期有系统发育学研究提出,应将平当树属(Paradombeya)合并入黄麻属(Corchoropsis),但两者在形态上存在明显差异,导致这一合并并未被广泛接受。解决这一争议的关键在于获得高质量的基因组证据。此外,辛氏平当树作为少数能适应干热河谷恶劣环境的木本植物,展现出非凡的抗旱能力,具有用于生态恢复和园艺开发的潜力。因此,构建其高质量的参考基因组,对于澄清其分类学地位、制定有效的保护策略以及挖掘其功能基因都显得至关重要,但在此之前,该物种的基因组资源仍处于空白状态。
为了填补这一空白,研究人员在《Scientific Data》上发表了题为“A haplotype-resolved gap-free chromosome assembly of the threatened plant Paradombeya sinensis”的研究论文。他们利用来自昆明植物园栽培的一株源自云南云河村野生种群个体的样本,综合运用了PacBio HiFi(38x覆盖度)、Oxford Nanopore(74x覆盖度)、Illumina短读长(135x覆盖度)、Hi-C和RNA-seq等多种测序技术。主要关键技术方法包括:使用Hifiasm进行初步组装,利用Hi-C数据进行染色体尺度支架构建并通过Juicebox进行手动校正,使用Nextpolish2进行抛光,以及通过整合证据(同源蛋白、转录组和从头预测)和EvidenceModeler进行基因结构注释和功能注释。
研究人员成功获得了辛氏平当树的高质量基因组组装。最终组装大小约为890 Mb,具有极高的连续性,其contig N50达到了44 Mb。尤为重要的是,该组装是无间隙的,99.93%的序列被成功锚定到20条伪染色体上(2n=20),每条染色体都包含了从端粒到端粒的完整序列。同时,还分别组装出了大小为426,438 bp的叶绿体基因组和160,291 bp的线粒体基因组。对重复序列的分析显示,重复序列占基因组的54.44%,其中以长末端重复反转录转座子(LTR retrotransposons)为主。这些指标共同表明这是一个高质量的染色体级别基因组组装。
在基因注释方面,研究团队通过证据整合的方法,共注释到68,639个基因,其中包括61,439个蛋白质编码基因。对注释结果的评估显示,BUSCO(Benchmarking Universal Single-Copy Orthologs)完整性高达99.1%,证明了基因注释的高质量。功能注释结果表明,绝大多数蛋白编码基因(98.69%)都能在至少一个功能数据库(如eggNOG、Swiss-Prot、InterProScan等)中找到对应信息,为后续的功能基因组学研究奠定了坚实基础。
为了确保组装和注释的准确性,研究进行了严格的技术验证。不同测序数据(HiFi、Illumina、RNA-Seq)与组装基因组的比对率均高达99%以上,表明组装序列的覆盖度和完整性极佳。通过分析HiFi数据的覆盖深度分布,证实了组装不存在冗余或同源区域塌陷的问题。利用Hi-C数据构建的交互热图显示出清晰的染色体内部结构,没有明显的错误组装。此外,研究人员还在所有染色体上鉴定出了端粒重复序列(TTTAGGG)n以及推测着丝粒区域的大串联重复序列,并且定位了5S和18S-5.8S-28S核糖体DNA(rDNA)阵列。LTR组装指数(LAI)的分析也进一步支持了组装的高质量。
综上所述,本研究成功构建了濒危植物辛氏平当树的第一个单倍型无间隙染色体级别基因组。该基因组组装质量高、注释完整,为解决其长期存在的系统发育分类争议(Paradombeya-Corchoropsis)提供了至关重要的基因组证据。同时,这一高质量的基因组资源也将极大地推动针对该物种的保护基因组学研究,例如界定管理单元、评估迁地保护效果、分析有害突变、探索其抗旱等适应性性状的遗传基础,并为其在生态恢复和园艺应用中的潜力开发提供科学依据。这项研究不仅填补了该物种基因组资源的空白,也为其他濒危植物的保护与研究提供了可借鉴的方法和思路。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号