编辑推荐:
茜草科植物的系统发育关系不明,且金鸡纳属高质量参考基因组缺乏。研究人员组装了近完整的金鸡纳树(Cinchona calisaya)基因组,解析了其系统发育关系。该研究为茜草科植物研究及药用植物遗传研究提供了重要基础。
在神秘的植物世界里,茜草科植物广泛分布于全球,它们不仅是经济作物的重要成员,如咖啡,还在医药领域有着举足轻重的地位。其中,金鸡纳树(
Cinchona calisaya)富含生物碱,是治疗疟疾的关键药材。然而,长期以来,茜草科植物的系统发育关系如同迷雾,一直困扰着科研人员。虽然此前有部分关于茜草科植物基因组的研究,但这些研究样本多集中在属一级,未能涵盖足够广泛的属,导致对该科植物的整体系统发育了解十分有限。此外,金鸡纳属现有的基因组信息存在诸多不足,如存在大量缺口,难以满足深入研究的需求。因此,开展对金鸡纳树高质量基因组的研究迫在眉睫,这对于揭示茜草科植物的进化历程、推动药用植物的遗传研究以及保护生物多样性都具有重要意义。
河北大学生命科学学院、生命科学与绿色发展研究所等机构的研究人员,针对上述问题展开了深入研究。他们成功组装出近完整的金鸡纳树基因组,该基因组大小为 869.93 Mb,contig N50 长度达 44.34 Mb ,且 99.75% 的序列成功锚定到 17 条染色体上,仅存在 12 个缺口。研究还发现了茜草科植物的系统发育关系,推断出金鸡纳亚科存在一轮独立的全基因组复制(WGD)事件,并对其核型进化和广泛的染色体重排进行了研究。这一成果发表在《Scientific Data》上,为茜草科植物的研究开辟了新的道路。
在研究过程中,研究人员主要运用了以下关键技术方法:首先,采集中国云南省西双版纳傣族自治州景洪市景讷的金鸡纳树新鲜叶片,提取高质量 DNA;然后利用 PacBio Sequel II 平台进行基因组测序,构建 Hi-C 文库并在 Illumina 平台测序,同时对根、茎、叶和树皮组织进行转录组测序;最后,通过 k-mer 分析估计基因组大小,运用 CANU、HERA 等软件进行基因组组装、评估和注释。
研究结果主要包含以下几个方面:
- 基因组组装:通过 PacBio HiFi reads 组装出 85 个 contigs,利用 Hi-C reads 将其锚定到 17 条假染色体上,最终得到 869.93 Mb 的基因组。其中 9 条染色体无缺口,其余染色体含 1 - 2 个缺口。同时,确定了所有着丝粒和大部分端粒的位置,组装质量评估各项指标优异,如 BUSCO 结果显示 98.30% 的单拷贝直系同源基因完整存在1。
- 基因组注释:共鉴定出 42,741 个基因,平均基因长度为 3,738 bp。大部分基因(87.8%)有预测的蛋白质结构域和功能位点,65.86% 的基因与基因本体(GO)术语相关,30.16% 的基因与京都基因与基因组百科全书(KEGG)通路相关。此外,还注释出大量转座子(TEs),占基因组的 66.12%23。
- 系统发育分析:进行系统发育分析,明确了茜草科植物的系统发育关系,推断金鸡纳亚科存在一轮独立的 WGD 事件。通过比较基因组分析,追溯了茜草科植物的核型进化和广泛的染色体重排,还发现了位于 11 号染色体上的托品酮还原酶局部串联重复基因簇。
研究结论表明,金鸡纳树高质量基因组的成功组装,为深入研究茜草科植物的进化、遗传和药用特性提供了坚实的基础。通过对其系统发育关系的解析,有助于更好地理解茜草科植物的多样性和演化历程。同时,基因组注释信息为挖掘金鸡纳树的药用基因资源、开发新型药物提供了重要线索。这一研究成果不仅推动了植物学领域的发展,也为医药研发和生物多样性保护提供了有力支持,具有重要的科学价值和应用前景。