濒危树种小勾儿茶(Berchemiella wilsonii)端粒到端粒(T2T)基因组组装及其进化与保护意义

《Scientific Data》:Telomere-to-Telomere genome assembly of an endangered tree Berchemiella wilsonii (Rhamnaceae)

【字体: 时间:2025年12月17日 来源:Scientific Data 6.9

编辑推荐:

  本研究针对我国极度濒危植物小勾儿茶(Berchemiella wilsonii)因缺乏高质量参考基因组而限制其进化历史研究与分类学争议的难题,通过整合PacBio HiFi、DNBSEQ和Hi-C测序技术,成功完成了该物种染色体级别、单倍型分型的端粒到端粒(T2T)基因组组装。组装结果显示单倍型A和B基因组大小分别为216.84 Mb和217.69 Mb,锚定至2n=24条染色体,BUSCO完整性评估高达98.9%,共注释到22,828个编码基因。该高质量基因组为揭示濒危植物的进化驱动力及解决悬而未决的分类学问题提供了宝贵的遗传资源。

  
在中国丰富的植物多样性宝库中,一些物种因其种群数量稀少、分布范围狭窄而显得尤为珍贵且脆弱,小勾儿茶(Berchemiella wilsonii (Schneid.) Nakai)便是其中之一。这种属于鼠李科(Rhamnaceae)的落叶阔叶灌木或小乔木,不仅被收录于《中国植物红皮书》,更是被列为中国国家重点保护野生植物以及“中国120种极小种群野生植物”之一,其生存状况堪忧。小勾儿茶的发现历程颇具传奇色彩:它于1907年由Ernest Wilson在湖北西部首次记录,但此后长达90余年未见踪迹,一度被推测已在野外灭绝。直到2001年,它才在距离模式产地约130公里的湖北后河国家级自然保护区被重新发现。尽管之后又找到了几个种群,但大多数规模都非常小,其生存依然面临严峻挑战。
小勾儿茶所属的小勾儿茶属(Berchemiella Nakai)是东亚特有属,共包含3个种和1个变种。其中,小勾儿茶(B. wilsonii)、云南小勾儿茶(B. yunnanensis)和毛柄小勾儿茶(B. wilsonii var. pubipetiolata)为中国特有,而日本小勾儿茶(B. berchemiifolia)则分布于日本和韩国。这四种植物都局限于极狭窄的地理范围和孤立的小种群。更令人担忧的是,野外调查发现,毛柄小勾儿茶的某些地方种群在过去几十年间已经灭绝,这很可能源于人类活动导致的栖息地破坏。而云南小勾儿茶自1940年在云南富宁县被采集后,再未被发现。因此,这四种植物在各自分布国均被列为濒危物种。然而,除了从毛柄小勾儿茶的种子萌发试验和保护遗传学研究中获得的一些线索外,驱动该属植物濒危的内在和外在因素仍知之甚少。例如,毛柄小勾儿茶的种子活力和萌发率均很低。保护遗传学研究显示,其种群遗传多样性从低到高不等,种群间基因流受限。
除了濒危状态,小勾儿茶属的分类学地位也长期存在争议。该属与其近缘属(如勾儿茶属Berchemia和苞叶木属Chaydaia)的系统发育关系一直悬而未决,缺乏基因组学证据。同样,属内四个分类单元之间的系统关系也不明确。例如,韩国的B. koreana曾被视为日本小勾儿茶的异名。而变种毛柄小勾儿茶的设立仅基于“叶柄具毛”这一个形态特征。2010年,在浙江绍兴发现的一个新种群被定名为小勾儿茶,但这一定性存在争议,因为该种群的地理分布远离小勾儿茶的其他种群,而所有已知的四个毛柄小勾儿茶种群恰好位于它们之间。这种基于形态观察带来的模糊物种界定,阻碍了有效的保护管理。
在过去二十年里,高通量DNA测序技术(如基因组重测序)极大地改善了非模式物种基因组数据的可获得性,并在保护基因组学和物种界定方面取得了突破。更重要的是,基因组组装已经进入了端粒到端粒(Telomere-to-Telomere, T2T)时代,正在革新基因组学研究。然而,小勾儿茶属的T2T基因组仍然空白。截至目前,鼠李科中仅有枣(Ziziphus jujuba)和鼠李猫乳(Rhamnella rubrinervis)等少数物种拥有参考基因组。这种高质量基因组资源的匮乏,阻碍了人们深入探究该濒危属种群衰退乃至局部灭绝的驱动因素,也限制了通过高分辨率物种界定来提升保护效能。
为了填补这一空白,一项名为《濒危树种小勾儿茶(鼠李科)的端粒到端粒基因组组装》的研究在《Scientific Data》上发表。研究人员旨在为小勾儿茶构建一个高质量的T2T参考基因组,为理解其进化历史、解决分类学争议以及制定有效的保护策略提供关键的基因组资源。
关键技术方法概述
研究人员采集自中国科学院武汉植物园的小勾儿茶样本,综合利用了PacBio HiFi长读长测序(约454×覆盖度)、DNBSEQ短读长测序(约1838×覆盖度)和Hi-C染色体构象捕获技术(约1548×覆盖度)进行全基因组测序。利用Hifiasm组装器进行初步单倍型分型组装,并结合Hi-C数据通过ALLHiC和Juicebox进行染色体挂载和手动优化,最终获得单倍型分型的染色体级别基因组。通过多种软件(如RepeatModeler, LTR_FINDER, RepeatMasker)进行重复序列注释,并采用转录组、同源比对和从头预测相结合的策略(使用HISAT2, StringTie, AUGUSTUS, MAKER等工具)进行基因结构注释和功能注释(比对Uniprot, NR, KOG, InterPro, KEGG等数据库)。
研究结果
基因组调查与特征评估
研究人员首先利用k-mer(k=19)分析方法对基因组进行初步调查。基于DNBSEQ短读长数据,使用Jellyfish和Genomescope v2.0进行k-mer频谱分析。结果显示,小勾儿茶的预估基因组大小约为199.38 Mb,杂合度约为0.53%,表明其基因组相对紧凑且杂合度较低,有利于高质量基因组的组装。
高质量T2T基因组组装
通过整合PacBio HiFi reads和Hi-C数据,研究团队成功构建了小勾儿茶的单倍型分型基因组。最终组装的单倍型A和单倍型B基因组大小分别为216.84 Mb和217.69 Mb,均被成功锚定到24条染色体(2n=24)上。组装连续性极高:单倍型A由13个contig组成,contig N50为18.24 Mb,仅存在1个缺口;单倍型B由12个contig组成,contig N50为18.03 Mb,实现了无缺口(gap-free)组装。所有染色体末端均检测到典型的端粒重复 motif (TTTAGGG)n,标志着该组装接近完整的T2T水平。BUSCO(Benchmarking Universal Single-Copy Orthologs)完整性评估显示,两个单倍型的完整BUSCO基因比例均高达98.9%,证明了基因组组装的高度完整性。Merqury评估的共识质量值(QV)单倍型A为60.72,单倍型B为59.65,也表明组装具有高准确性。此外,LTR组装指数(LAI)在单倍型A和B中分别为20.3%和18.76%,进一步证实了组装的卓越连续性。Hi-C互作热图清晰地显示出24条明确的染色体骨架,无明显染色体级别错误。
端粒和着丝粒区域鉴定
研究人员利用生物信息学方法对端粒和着丝粒区域进行了精确识别。通过比对PacBio HiFi reads并分析端粒特征序列,成功鉴定了所有染色体末端的端粒区域。对于着丝粒,通过识别基因组中的串联重复(Tandem Repeats, TR),进行聚类分析,并结合基因密度分析,最终确定了每条染色体上的着丝粒候选区域,并通过RIdeogram包进行了可视化展示。
重复序列与基因注释
基因组重复序列注释结果显示,单倍型A和B中重复序列分别占基因组的43.77%(94.89 Mb)和43.85%(95.45 Mb)。其中,长末端重复反转录转座子(LTR retrotransposons)是主要的重复类型,分别占基因组的21.01%(45.57 Mb)和19.72%(42.92 Mb),Gypsy和Copia是其中最丰富的亚型。串联重复(包括微卫星)分别占基因组的5.23%和5.19%。
基因结构注释共预测出单倍型A和B分别含有22,828和22,945个蛋白质编码基因。单倍型A的基因平均含有5.59个外显子,单外显子基因占比18.20%。功能注释显示,分别有96.34%(21,992个)和96.23%(22,079个)的基因能够与公共蛋白数据库匹配,获得了功能注释信息。此外,还注释了大量非编码RNA,包括rRNA和tRNA等。
基因组进化分析
通过与其他14个物种(包括枣、鼠李猫乳、拟南芥、水稻等)的比较基因组学分析,构建了系统发育树并估算了物种分化时间。分析确认小勾儿茶与鼠李猫乳亲缘关系最近,它们的分化时间大约在1060万年前(~10.6 Mya)。基因家族分析显示,小勾儿茶的两个单倍型分别发生了扩张和收缩的基因家族。其中,单倍型A有176个基因家族(641个基因)扩张,260个基因家族(451个基因)收缩;单倍型B有143个基因家族(539个基因)扩张,318个基因家族(612个基因)收缩。这些发生显著扩张/收缩的基因家族富集到了3084个GO(Gene Ontology)条目和22条KEGG(Kyoto Encyclopedia of Genes and Genomes)通路,可能与小勾儿茶的适应性进化或濒危机制相关。
共线性(Synteny)分析和同义替换率(Ks)分析表明,小勾儿茶与鼠李猫乳之间存在大范围的共线性区块,且Ks分布峰值位于~1.6附近,未检测到近期的全基因组复制(WGD)事件。
研究结论与意义
本研究成功完成了濒危树种小勾儿茶的高质量、染色体级别、单倍型分型的端粒到端粒(T2T)基因组组装。该基因组在连续性、完整性和准确性方面均表现出色,是鼠李科中首个报道的T2T级别基因组。
这项研究具有多重重要意义:首先,它为解决小勾儿茶属内长期存在的系统发育和分类学争议(如种间关系、变种有效性)提供了可靠的基因组框架,未来通过重测序不同种群和近缘物种,可进行高分辨率的物种界定。其次,这个高质量的参考基因组为开展保护基因组学研究奠定了基础,有助于从基因组层面深入探究导致小勾儿茶及其近亲濒危的内在因素(如低遗传多样性、近交衰退)和外在压力。此外,该基因组也为理解鼠李科植物的进化历史、基因组特征和适应性进化提供了宝贵数据。最后,研究中应用的多种测序技术结合与生物信息学分析流程,也为其他濒危非模式植物的基因组学研究提供了可借鉴的范例。
总之,小勾儿茶T2T基因组的发布,不仅是对该极度濒危物种保护的重要贡献,也极大地推动了保护基因组学和进化生物学研究的发展,有望为类似濒危植物的保护与管理带来新的启示。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号