编辑推荐:
为解决细头拟赤梢鱼(Pseudaspius leptocephalus)人工养殖和资源保护难题,中国科学院水生生物研究所等单位的研究人员开展其基因组研究,成功获得染色体水平基因组序列。该成果对鱼类保育、养殖及进化研究意义重大,值得一读。
在我国黑龙江流域,生活着一种特别的鱼 —— 细头拟赤梢鱼(Pseudaspius leptocephalus),它还有个亲切的名字叫 “雅罗” 鱼。这种鱼肉质鲜嫩,没有腥味,是黑龙江流域的优质本土鱼类,深受人们喜爱。它在生态系统中也扮演着重要角色,幼鱼主要以水生浮游生物和底栖生物为食,成年后则以小鱼为食,是维持水域生态平衡的关键一环。
然而,近年来,细头拟赤梢鱼的日子并不好过。随着过度捕捞和环境恶化,它们的野生种群数量急剧下降。曾经,它们在黑龙江、乌苏里江和松花江及其支流中欢快畅游,如今却只能在黑龙江上游和乌苏里江中下游的少数区域偶尔被发现。研究人员通过对其线粒体 COI 基因的分析,发现黑龙江流域细头拟赤梢鱼种群的遗传多样性很低,这意味着它们可能经历了遗传瓶颈,面临着严峻的生存挑战。
面对这种情况,人工养殖成为了保护细头拟赤梢鱼的重要途径。通过人工繁殖和养殖,可以增加它们的数量,减轻对野生种群的捕捞压力,还能满足市场对这种鱼的需求。但是,目前的人工养殖面临着诸多技术难题,比如对细头拟赤梢鱼的遗传信息了解不足,缺乏关键的基础数据支持,这使得人工养殖的效率难以提高,资源保护和开发也受到限制。
为了深入了解细头拟赤梢鱼,解决这些棘手的问题,中国科学院水生生物研究所和中国水产科学研究院黑龙江水产研究所的研究人员开展了一项重要研究。他们在《Scientific Data》期刊上发表了题为 “Chromosome-level genome assembly of Pseudaspius leptocephalus (Cypriniformes, Leuciscidae) using PacBio sequencing and Hi-C technology” 的论文。通过研究,他们成功获得了细头拟赤梢鱼染色体水平的基因组序列,这一成果为细头拟赤梢鱼的人工养殖、生物资源保护以及未来的基因组和进化研究提供了重要的基础,就像为保护和研究这种鱼点亮了一盏明灯。
在这项研究中,研究人员运用了几种关键技术方法。首先是 PacBio 长读长测序技术,它能够读取较长的 DNA 片段,为基因组的组装提供了基础数据。接着是 Hi-C 技术,利用该技术可以将测序得到的片段准确地定位到染色体上,从而获得染色体水平的基因组序列。此外,研究人员还进行了转录组测序,对细头拟赤梢鱼的多个组织进行分析,为基因注释提供了重要信息 。
下面来看看具体的研究结果。
- 基因组组装:研究人员从黑龙江水产研究所获取了一条健康成熟的细头拟赤梢鱼,提取其肌肉组织的 DNA 构建基因组文库,然后用 PacBio Sequel II 系统进行测序。之后,他们用 hifiasm 0.18.5 软件对测序数据进行组装,得到了包含 1630 个重叠群(contig)的初稿基因组,其大小为 889.21Mb,N50 达到 10.97Mb。为了进一步将这些重叠群定位到染色体上,研究人员构建了 Hi-C 文库并测序。经过一系列处理,最终获得了 25 条染色体序列,成功完成了染色体水平的基因组组装,且染色体长度在 23.70Mb 到 50.34Mb 之间,基因组有 1230 个支架(scaffold),支架 N50 为 33.55Mb 。
- 重复注释:研究人员利用 EDTA 软件对细头拟赤梢鱼基因组中的重复序列进行注释。结果发现,重复序列占基因组总长度的 39.5%,其中转座子(TEs)就有 332.6Mb。在转座子中,DNA 转座子元件有 192.8Mb,占 21.68%;反转录转座子元件有 139.7Mb,占 15.71% 。而且不同类型的转座子在基因组中所占比例也不同,像 DNA 转座子中的末端反向重复元件(TIRs)占 17.88%,helitron 元件占 2.62%;反转录转座子中的长散在核元件(LINEs)占 7.02%,短散在核元件(SINEs)占 0.36%,长末端重复元件(LTRs)占 6.95% 。
- 基因注释:研究人员采用了一种综合策略来进行基因注释,结合了基于同源性的预测、基于转录本的预测和从头(de novo)预测三种方法。他们先对细头拟赤梢鱼的 9 个组织进行转录组测序,然后用相关软件处理数据并预测基因。同时,将其他几种鱼类的蛋白质序列与细头拟赤梢鱼的基因组进行比对,还用 BRAKER3 软件进行从头预测。最后,用 EvidenceModeler 2 软件将三种方法预测得到的基因合并,总共得到了 25,531 个蛋白质编码基因。在功能注释方面,研究人员将这些基因与多个数据库进行比对,最终成功注释了 24,787 个基因,占总数的 97.0% 。此外,他们还用 Infernal 1.0 和 Rfam 14.3 数据库预测非编码 RNA,在基因组中鉴定出了 1,378 个微小 RNA(miRNAs)、18,027 个转运 RNA(tRNAs)、12,421 个核糖体 RNA(rRNAs)和 2,731 个小核 RNA(snRNAs) 。
- 数据记录:研究人员把所有的原始数据都进行了妥善保存。全基因组原始数据存放在美国国立生物技术信息中心(NCBI)的序列读取档案(SRA)数据库中,PacBio 基因组测序数据、Hi-C 测序数据和 RNA 测序数据也都有各自对应的编号。最终的染色体水平基因组组装结果存放在 NCBI 基因组数据库中,基因组注释以及预测的编码序列和蛋白质序列可以在 Figshare 上获取,方便其他研究人员使用和参考 。
- 技术验证:在实验过程中,研究人员对用到的 DNA 和 RNA 质量进行了严格验证,确保实验数据的准确性。他们还用 BUSCO 分析和短读长映射等方法评估基因组组装的质量。结果显示,基因组组装的完整性非常高,97.3% 的保守单拷贝直系同源基因都能被检测到,而且通过与斑马鱼(Danio rerio)的基因组比对,发现细头拟赤梢鱼的染色体与斑马鱼的染色体具有很高的同源性 。在基因注释的评估中,BUSCO 分析表明,注释的基因集中 93.7% 是完整基因 。
综合来看,这项研究成功获得了细头拟赤梢鱼染色体水平的高质量基因组序列。这一成果意义重大,它为细头拟赤梢鱼的人工繁殖提供了关键的遗传信息,研究人员可以根据这些信息选育优良品种,提高繁殖效率,让人工养殖的细头拟赤梢鱼更快更好地成长。对于生物资源保护而言,通过了解其基因组,能够制定更科学有效的保护策略,帮助野生细头拟赤梢鱼种群恢复生机。同时,这个基因组序列也为后续研究细头拟赤梢鱼的环境适应性、进化历程等提供了重要基础,让我们能更深入地探索这种鱼在自然界中的奥秘,为保护和合理利用这一珍贵的生物资源奠定了坚实的基础 。