编辑推荐:
为促进紫背天葵保护与利用,研究人员组装其基因组,获高质量结果,对物种研究意义重大。
# 探秘紫背天葵基因组:珍稀药用植物的保护与发展新契机
在神秘的植物王国里,
紫背天葵(
Begonia fimbristipula Hance)是一种独特的存在。它属于秋海棠科(Begoniaceae),是多年生草本植物,在中国东南部的浙江、江西、湖南等地以及泰国部分地区都能找到它的踪迹。
紫背天葵不仅具有观赏价值,更是一种珍贵的药用植物,其精油对罗非鱼的无乳链球菌有抑制作用,还能作为食物来源,深受当地人们喜爱。
然而,紫背天葵的生存面临着诸多挑战。气候变化的影响、人类活动的干扰,尤其是当地对其作为草药茶原料的需求,使得这种植物的数量逐渐减少,在 2023 年被广东省列为保护野生植物。在植物保护领域,基因组研究是关键手段,但目前已公布的秋海棠属植物基因组仅有 4 种,紫背天葵高质量基因组的缺失,严重阻碍了对其深入研究,不利于该物种的保护和合理利用。
为了填补这一空白,中国科学院华南植物园的研究人员展开了深入研究。他们的研究成果发表在《Scientific Data》杂志上,为紫背天葵的保护和利用带来了新的曙光。
研究人员运用了多种关键技术来完成这项研究。首先是样本采集与测序技术,他们从广东肇庆鼎湖山采集了紫背天葵的新鲜幼叶和果实样本,利用牛津纳米孔技术(ONT)、下一代测序技术(NGS)、高通量染色体构象捕获技术(Hi-C)和转录组测序(RNA-seq)进行测序。接着通过一系列生物信息学分析方法,如使用Jellyfish和GenomeScope估算基因组大小,运用NextDenovo进行基因组组装,采用EDTA和RepeatMasker进行重复序列注释,利用多种软件进行基因预测和功能注释等。
基因组测序与组装
研究人员对紫背天葵进行基因组测序,得到了 ONT、NGS、Hi-C 和 RNA-seq 等多组数据。通过GenomeScope分析,预估其基因组大小为 439.94 Mb,杂合率为 1.45%。利用NextDenovo软件进行组装,得到了长度为 462.11 Mb 的基因组,scaffold N50 达到 38.22 Mb 。经过 Hi-C 技术辅助,91.96%(424.94 Mb)的序列成功锚定到 11 条假染色体上,各染色体长度在 23.65 Mb(chr3)到 74.55 Mb(chr8)之间。
重复序列与基因注释
研究人员借助EDTA软件识别出大量重复序列,这些序列占基因组的 64.63%(274.62 Mb),其中长末端重复序列(LTRs)最为常见,占基因组的 53.85%(146.60 Mb),Gypsy 元件(28.43%)和 Copia 元件(21.50%)是主要的 LTR 类型。此外,研究人员还预测出 25,563 个蛋白质编码基因和 274 个 tRNA 基因 。通过多种公共数据库进行功能注释,发现 97.29% 的蛋白质编码基因在 eggNOG 数据库中得到注释,87.79% 的基因在 InterProScan 数据库中被识别。
基因组质量评估
为确保基因组的准确性和完整性,研究人员进行了多项评估。利用 Benchmarking Universal Single-Copy Orthologs(BUSCO)评估,发现紫背天葵基因组的完整 BUSCOs 达到 90.3%。计算 LTR 组装指数(LAI),得到的值为 17.73。通过 Merqury 评估碱基准确性,k-mer-based QV 为 24.61,k-mer 完整性为 61.41% 。Hi-C 热图显示 11 条假染色体在对角线上有强烈的交互信号,ONT 和 RNA-seq reads 的映射率分别为 89.30% 和 87.16%。
这项研究成功组装出紫背天葵的染色体水平基因组并完成注释,为深入了解该物种的基因组特征奠定了坚实基础。高质量的基因组数据为紫背天葵的保护提供了有力的科学依据,研究人员可以基于此制定更有效的保护策略,比如通过分析其基因组中的关键基因,了解其对环境变化的适应性,为物种的迁地保护和就地保护提供指导。在经济利用方面,有助于挖掘其药用价值相关的基因,为开发新的药物和健康产品提供可能,促进相关产业的发展。从进化研究角度来看,对紫背天葵基因组的分析,能够帮助科学家更好地理解秋海棠属植物的进化关系,探究物种的演化历程和遗传多样性,为整个植物进化领域的研究贡献重要力量。
综上所述,紫背天葵基因组的成功组装和注释,是植物研究领域的重要突破,为珍稀药用植物的保护和利用开辟了新的道路,也为后续更深入的研究提供了宝贵的资源和方向。