编辑推荐:
为解决云南芙蓉(Hibiscus yunnanensis)缺乏高质量参考基因组,阻碍其生态和分子生物学研究的问题,研究人员开展了对云南芙蓉进行高质量染色体水平基因组组装的研究。结果获得了 2.2Gb 的基因组,99.2% 的序列锚定到 17 条假染色体,注释出 42,085 个蛋白编码基因。该研究为后续相关研究奠定基础12。
在繁花似锦的植物世界里,芙蓉属(
Hibiscus)植物凭借着色彩艳丽、形态各异的花朵,成为了大自然中一道亮丽的风景线。它们不仅具有极高的观赏价值,在药用、食用、纺织等领域也有着广泛的应用。然而,云南芙蓉(
Hibiscus yunnanensis S.Y. Hu)这一独特的物种,却面临着生存的挑战。它仅分布在云南玉溪元江哈尼族彝族傣族自治县,生长环境特殊,多在海拔 400 - 600 米阳光充足、干燥炎热的山坡上。由于分布范围狭窄,成熟个体数量有限,加上栖息地质量下降,它已被列为濒危物种。
更令人担忧的是,目前缺乏云南芙蓉高质量的参考基因组,这严重阻碍了对其生态和分子生物学的深入研究。例如,它独特的适应干旱炎热环境的机制、冬季开花的特性,以及自动自交却无近交衰退现象背后的遗传基础等,都亟待解开。为了填补这些知识空白,中国科学院昆明植物研究所的研究人员勇挑重担,开展了一项具有重要意义的研究。
研究人员通过采集云南芙蓉个体,自花授粉后取第二代植株的新鲜幼叶用于 DNA 提取,并收集多种组织进行转录组测序。随后,运用 BGI-DIPSEQ、Nanopore 和 Hi-C 测序技术,对云南芙蓉的基因组进行了全面解析。经过一系列复杂的分析流程,最终成功获得了高质量的染色体水平基因组组装结果。该研究成果发表在《Scientific Data》上,为云南芙蓉的研究开辟了新的篇章。
在研究方法上,研究人员主要运用了以下关键技术:一是测序技术,包括 BGI-DIPSEQ 测序获得短读长数据,Nanopore 测序获得长读长数据,Hi-C 测序用于染色体构象捕获;二是多种软件结合进行基因组组装与优化,如 NextDenovo、Canu、Wtdbg2、Flye 等软件;三是利用多种工具进行基因预测与功能注释,像 Augustus、GlimmerHMM、SNAP 等用于基因预测,BLASTP、InterProScan 用于功能注释349。
下面来看具体的研究结果:
- 基因组组装与特征:研究人员通过 k-mer 分析估计云南芙蓉基因组大小约为 2.2Gb,经过复杂的组装流程,最终得到的组装基因组大小与之相近。其 contig N50 达到 12.1Mb,scaffold N50 为 137.1Mb,99.2% 的组装序列成功锚定到 17 条假染色体上。BUSCO 分析显示,基因组完整性得分高达 99.6%,这表明所获得的基因组组装质量非常高256。
- 重复序列鉴定:运用从头预测和基于同源性的方法,研究人员发现云南芙蓉基因组中重复序列占比为 73.2%。其中,LTR/Gypsy 元件占 42.5%,这些重复序列在基因组的结构和进化中可能起着重要作用7。
- 蛋白编码基因预测与注释:综合多种预测方法,研究人员共鉴定出 42,085 个蛋白编码基因。通过序列相似性和结构域保守性分析,96.4% 的基因获得了功能注释。这些基因的注释信息为深入研究云南芙蓉的生物学特性提供了重要线索89。
研究结论和讨论部分,本次研究成功完成了云南芙蓉染色体水平的基因组组装,为后续深入研究其独特性状的遗传机制提供了坚实基础。例如,有助于揭示其耐旱、适应稀树草原环境以及冬季开花的分子机制。同时,其自动自交且无近交衰退的特性,也为研究花柱弯曲机制及其在锦葵科植物中的适应性意义提供了绝佳模型。这不仅丰富了人们对云南芙蓉这一濒危物种的认识,也为保护和合理利用这一珍贵植物资源提供了有力的科学依据,在植物保护遗传学和进化生物学领域具有重要的理论和实践价值。