编辑推荐:
高山植物适应机制不明,为探究其奥秘,研究人员对紫花岩白菜(Bergenia purpurascens)展开基因组研究。成功组装其染色体级基因组,注释众多基因。该成果助力研究岩白菜素生物合成及植物适应高山环境,意义重大。
在地球的高山之巅,那里的植物就像勇敢的 “探险家”,要面对低温、强紫外线、干燥以及短暂生长季等重重挑战。目前,由于高质量参考基因组有限,科学家们对高山植物适应这些恶劣环境的遗传机制了解甚少。而喜马拉雅 - 横断山脉(HHM)是地球上高山植物的 “宝库”,紫花岩白菜(Bergenia purpurascens)作为其中的一员,不仅是重要的药用植物,其根茎能提取治疗呼吸道和胃部疾病的岩白菜素,还是颇具观赏价值的花卉 。并且,它在属内分布海拔最高、范围最广,对气候变化极为敏感,正面临种群灭绝的危机。所以,对紫花岩白菜进行研究,就像是为揭开高山植物适应之谜找到了一把 “钥匙”。
南昌大学等研究机构的科研人员针对紫花岩白菜展开了深入研究。他们成功组装出紫花岩白菜的染色体级基因组,这一成果意义非凡,有助于深入探究岩白菜素的生物合成路径,增进人们对植物适应高山环境遗传基础的理解,还能为保护和可持续利用这一珍贵种质资源提供有力支持,相关研究成果发表在《Scientific Data》杂志上。
研究人员采用的关键技术方法主要有:从云南玉龙雪山采集样本后,利用 Qiagen DNeasy Plant Mini Kit 提取基因组 DNA 和总 RNA 。通过 Illumina 测序、第三代太平洋生物科学环形一致测序(CCS)和高通量染色体构象捕获(Hi-C)测序相结合的方式,对基因组进行测序。之后运用多种生物信息学工具,如 SOAP、Hifasm、Purge_dups、HiC - Pro、LACHESIS 等进行基因组组装和注释。
基因组测序与组装
研究人员先对采集的样本进行测序。Illumina 测序产生了 50.71 Gb 原始数据,经处理得到 45.02 Gb 的 clean reads,用于基因组调查。PacBio 测序得到 24.85 Gb 高保真(HiFi)clean 数据,Hi - C 测序产生约 72.85 Gb reads。通过一系列复杂的生物信息学分析,估计基因组大小为 634.52 Mb,最终组装出大小为 650.70 Mb 的基因组,scaffold N50 达 34.19 Mb,93.43% 的序列成功锚定到 17 条假染色体上。
基因组注释与功能预测
在基因组注释方面,研究人员利用 RepeatModeler、RepeatMasker 等工具构建重复序列数据库并识别重复序列,发现长末端重复序列(LTRs)是最丰富的散在重复类型。运用 MAKER 及多种预测工具,结合转录组和蛋白质同源性证据,预测出 45,841 个蛋白质编码基因。通过与多个数据库比对,对 41,738 个基因进行了功能注释。此外,还预测出多种非编码 RNA,包括 172 个 microRNAs(miRNAs)、1,176 个转移 RNAs(tRNAs)、134 个小核仁 RNAs(snRNAs)和 9,175 个核糖体 RNAs(rRNAs)。
研究结论与讨论
研究人员成功获得了紫花岩白菜高质量的染色体级基因组,全面注释了各类基因和非编码 RNA。这一成果为研究岩白菜素生物合成提供了关键线索,有助于深入剖析其合成途径中的关键基因和调控机制。在植物适应高山环境方面,基因组信息也为揭示相关遗传基础提供了重要依据,后续可进一步研究适应过程中的关键基因和信号通路。同时,该研究为紫花岩白菜的保护和可持续利用提供了有力的遗传数据支持,比如可依据基因组信息制定更科学的保护策略,合理开发利用其药用价值。总之,这项研究为高山植物的研究开辟了新的道路,对生命科学和健康医学领域有着重要的推动作用。