编辑推荐:
为解决见血封喉(Antiaris toxicaria)分子遗传研究受限问题,研究人员组装其染色体水平基因组,助力相关研究。
见血封喉基因组组装研究解读
在神秘的植物世界里,见血封喉(Antiaris toxicaria)宛如一颗璀璨又危险的 “明星”。它属于桑科高大乔木,在中国广东、海南、广西和云南南部地区扎根生长。见血封喉可不简单,它不仅有观赏价值,能为生态环境贡献力量,还承载着独特的文化意义。更重要的是,它的乳汁和种子富含强心苷,叶子和树枝的汁液含有如 α- 见血封喉苷(α-antiarin)、见血封喉糖苷(antioside)和铃兰毒苷(convallatoxin)等高毒性物质 ,这些成分在增强心脏功能、引发呕吐腹泻以及麻醉等方面有着特殊作用,同时还含有没食子酸、儿茶素等多种成分,因此在医学研究和商业领域极具价值。
然而,科研之路并非一帆风顺。由于缺乏见血封喉的基因组资源,对其药用成分的分子遗传研究就像被捆住了手脚,难以深入探索。为了打破这一困境,中国科学院华南植物园等机构的研究人员挺身而出,开展了一项意义重大的研究 —— 构建见血封喉染色体水平的基因组组装。最终,他们成功完成了这一艰巨任务,该研究成果发表在《BMC Genomic Data》上,为见血封喉的研究打开了新的大门。
在这项研究中,研究人员运用了多种关键技术。他们从中国广州华南植物园采集见血封喉的新鲜叶片,利用 PacBio HiFi、ONT 超长测序和 Hi-C 测序技术获取数据。其中,PacBio HiFi 测序用于构建无 PCR 扩增的 SMRTBell 文库;ONT PromethION 测序仪生成 ONT 超长读长;Hi-C 文库则在 BGI 平台构建和测序。同时,采集茎、叶和种子用于转录组分析。研究人员还通过一系列生物信息学工具,如使用 GCE 评估基因组大小,Hifiasm 软件进行基因组组装等,对数据进行处理和分析。
研究结果丰富且具有重要意义,主要包括以下几个方面:
- 基因组组装:研究人员成功组装出见血封喉的两个单倍型基因组。HapA 亚基因组大小约为 671.73 Mb,包含 27,213 个基因,contig N50 达到 90.18 Mb;HapB 亚基因组大小约 666.41 Mb,有 28,840 个基因,contig N50 为 90.29 Mb。这两个单倍型基因组共包含 26 条假染色体,为深入研究见血封喉的遗传信息奠定了坚实基础。
- 基因组特征评估:通过多种评估手段,发现该基因组完整度高。利用 BUSCO v4.1.2 搜索胚胎植物数据库(embryophyta_odb10),结果显示两个单倍型中完整的 BUSCO(包括单拷贝和多拷贝)比例分别达到 98.5% 和 98.6%。使用 LAI v3.2 程序评估重复基因组区域质量,HapA 和 HapB 的 LAI 值分别为 16.4 和 14.72。用 Merqury v1.365 估计碱基一致性准确性(QV),HapA 和 HapB 的 QV 值分别为 47.13 和 47.1。此外,测序数据的基因组覆盖率超过 99%,这些数据充分表明了组装基因组的高质量。
- 基因预测与功能注释:研究人员综合运用同源性预测、基于转录组预测和从头预测等方法,对蛋白质编码基因进行预测。最终,在 HapA 和 HapB 亚基因组中分别获得 27,213 个和 28,840 个蛋白质编码基因,并且大部分基因得到了多个功能数据库的支持。同时,对这些基因进行功能注释,为了解基因功能和潜在应用提供了重要线索。
- 转座元件(TEs)和非编码 RNA 预测:运用 EDTA v2.1.0 管道预测转座元件,发现 HapB 亚基因组中 TEs 占比 64.13%,高于 HapA 亚基因组。其中,长末端重复反转录转座子(LTRs)是主要的重复序列,Copia 和 Gypsy 型 LTRs 是最大的 LTR 亚家族。此外,还鉴定出 456 个 tRNA、111 个 miRNA,以及在 HapA 和 HapB 亚基因组中分别鉴定出 1,637 个和 1,182 个 rRNA 。
研究结论表明,研究人员成功完成了见血封喉染色体水平的基因组组装,全面解析了其基因组特征、基因组成、转座元件和非编码 RNA 等信息。这一成果意义非凡,为深入研究见血封喉药用成分的生物合成机制提供了关键资源,有助于挖掘更多潜在的药用价值,推动相关药物研发。同时,也为见血封喉的有效保护和合理利用提供了遗传学依据,在生命科学和医学领域都有着不可忽视的重要意义。未来,基于这些研究成果,有望在见血封喉的研究和应用方面取得更多突破,让这一神秘的植物为人类健康和生态保护发挥更大的作用。