编辑推荐:
为解决大规模泥鳅(Paramisgurnus dabryanus)因缺乏高质量参考基因组,导致性别决定、毒理学等研究受阻的问题,研究人员开展其基因组组装与注释研究。成功构建染色体水平基因组,含 24 条染色体、28,311 个蛋白编码基因,为相关研究奠基。
在神秘的水生生物世界里,大规模泥鳅(Paramisgurnus dabryanus)作为一种重要的经济鱼类,广泛分布于东亚地区。它不仅肉质鲜美,富含蛋白质、脂肪、矿物质和多种维生素,具有极高的营养价值,而且生长速度快,还拥有独特的呼吸空气能力以及温度依赖性性别决定机制,吸引了众多科研人员的目光。然而,长期以来,大规模泥鳅的研究一直受到一个关键问题的制约 —— 缺乏高质量的参考基因组。
这一缺失使得在研究其性别决定机制时困难重重。尽管已知大规模泥鳅的性别染色体遵循 ZZ/ZW 系统,且温度对其性别比例影响显著,如 20°C 时雌雄比例为 1:1,25°C 时雄性比例超 70% ,但由于没有参考基因组,寻找通用的性别特异性分子标记进展缓慢,对温度影响性别决定的分子机制研究也仅停留在初级阶段。在其他研究领域,如毒理学、饲料营养、生长和遗传进化等方面,缺乏参考基因组同样成为深入探究的绊脚石。例如,在研究大规模泥鳅对氨的耐受性和解毒机制时,由于缺乏基因组支持,只能依赖从头测序(de novo)策略,仅能关注有限数量的基因,无法全面揭示相关机制。
为了突破这些困境,中国科学院水生生物研究所的研究人员勇挑重担,开展了一项极具意义的研究。他们旨在构建大规模泥鳅的染色体水平参考基因组,为解开其复杂的遗传密码奠定基础。
研究人员历经重重困难,最终成功构建出大规模泥鳅的高质量染色体水平基因组。这一基因组由 24 条染色体组成,总长度达 1.04 Gb,支架 N50 为 41.7 Mb,BUSCO 完整性高达 95.8%,还包含 28,311 个蛋白编码基因,其中 97.49% 得到了注释。这一成果意义非凡,为大规模泥鳅的分子标记开发、关键基因识别以及分子机制阐释提供了重要的数据支持,也为后续的组学研究、系统发育分析和遗传育种工作搭建了坚实的平台。该研究成果发表在《Scientific Data》上,为水生生物研究领域带来了新的曙光。
在研究过程中,研究人员运用了多种关键技术方法。首先,从武汉白沙洲水产品市场采集样本,通过水母(Jellyfish)和 GenomeScope 分析基因组杂合度,选取合适的性成熟雌性个体进行雌核发育诱导。接着,利用 Illumina 测序技术进行全基因组重测序,结合 GenomeScope 估算基因组大小和杂合度。然后,通过 Hi-C 测序构建染色体三维结构信息,PacBio 测序获得高质量长读长数据。最后,运用 hifiasm 软件进行重叠群(contig)组装,Lachesis 软件进行染色体挂载,并使用多种软件进行基因预测、注释和分析。
下面来看具体的研究结果:
- 基因组组装与特征:利用 PacBio HiFi 和 Hi-C 测序技术,对大规模泥鳅雌性(ZW)样本进行测序,组装得到染色体水平基因组。通过多种软件处理数据,确定最终基因组包含 24 条染色体,长度为 1,043,469,091 bp,含 219 个重叠群。其支架 N50 达 41.7 Mb,显示出较好的连续性,BUSCO 完整性为 95.8%,表明基因组质量较高。
- 重复序列与基因注释:经分析,重复序列占基因组的 58.99%,其中 DNA 转座子占比最多。通过从头预测、同源性预测和转录组预测三种互补方法,共鉴定出 28,311 个基因,并对这些基因进行功能注释,确定了其在不同数据库中的注释情况。同时,对非编码 RNA(ncRNA)进行注释,包括 tRNA、rRNA、miRNA、snoRNA 和 snRNA 等。
- 染色体共线性分析:将大规模泥鳅与其他两种泥鳅(池塘泥鳅和高原泥鳅)进行染色体共线性分析,发现三者基因组存在显著共线性,验证了基因组组装和注释的质量。此外,通过对已知性别特异性分子标记的分析,确定了大规模泥鳅的性染色体。
研究结论表明,研究人员成功构建了大规模泥鳅的染色体水平基因组,为该物种的深入研究提供了关键数据。这一成果有助于进一步探究大规模泥鳅的性别决定机制、遗传进化规律,为其遗传育种提供理论依据,推动水产养殖业的发展。同时,高质量的基因组也为其他相关领域的研究,如毒理学、饲料营养研究等提供了有力支持。在未来,基于这一基因组,科研人员有望在大规模泥鳅的各个研究方向取得更多突破,为水生生物研究领域贡献更多有价值的成果。