编辑推荐:
为推动牛蛙相关研究,研究人员构建其染色体水平基因组,成果助力进化、功能基因组学及分子育种研究。
# 美国牛蛙染色体水平基因组组装研究解读
在大自然的生物舞台上,美国牛蛙(Aquarana catesbeiana)是个极具特色的角色。它既是备受青睐的水产养殖明星,为人们提供美味佳肴;又是全球扩张的 “生态侵略者”,凭借强大的环境适应能力,入侵到四大洲超 40 个国家,严重威胁本土物种的生存。而且,作为两栖纲无尾目动物的代表,美国牛蛙在发育生物学、生理学、生态学和进化等众多研究领域都是不可或缺的 “主角”。此前,虽然在 2017 年就有美国牛蛙的草图基因组公布,但质量欠佳,其 scaffold N50 仅 51.6 Kb ,BUSCO 完整性只有 45.3%,这就像一幅模糊不清的地图,严重阻碍了深入探索牛蛙奥秘的脚步。为了填补这些知识空白,解锁牛蛙的遗传密码,来自仲恺农业工程学院动物科学与技术学院等机构的研究人员踏上了探索之旅,他们的研究成果发表在《Scientific Data》上。
研究人员在本次研究中主要运用了以下关键技术方法:首先,从广东省清远阳山养殖基地的一只雌性美国牛蛙身上采集多种组织样本,包括肌肉、肠道、肺等。接着,利用 Pacific Biosciences(PacBio)HiFi 测序、MGI 短读长测序和 Hi-C 测序技术获取基因组数据。然后,使用基于 K-mer 的分析方法估计基因组大小,通过 hifiasm 等软件进行基因组组装,并借助 Hi-C 技术构建伪染色体。最后,综合转录组测序、同源性预测和从头预测等方法进行基因注释。
下面来详细看看研究的主要结果:
- 基因组大小与组装:研究人员通过基于 K-mer 的分析方法,估算出美国牛蛙的基因组大小约为 5.81 Gb,基因组杂合度为 0.51%。利用 PacBio HiFi reads、MGI 短读长和 Hi-C reads 数据,经过一系列严格的组装流程,最终得到了 6.32 Gb 的高质量染色体水平基因组组装,由 13 条伪染色体组成,scaffold N50 达到 691.8 Mb ,覆盖了原始基因组的 99.21%。
- 基因注释与功能分析:在基因注释方面,研究人员运用了多种方法预测重复序列和基因结构。经检测,重复序列占组装基因组的 79.51%。总共注释出 32,382 个基因,平均基因长度为 58,248.47 bp,平均 CDS 长度为 1,264.88 bp,每个基因平均有 6.55 个外显子。功能注释显示,98.96% 的基因在蛋白质数据库中得到注释,这为深入了解牛蛙基因功能奠定了基础。
- 基因组质量评估:为了确保基因组组装的可靠性,研究人员进行了全面的质量评估。通过多种软件和指标检测,如使用 Nanodrop 分光光度计和琼脂糖凝胶电泳评估 gDNA 质量,利用 2100 Bioanalyzer 分析 RNA 质量,运用 minimap2 软件、BUSCO 和 Merqury 等工具评估基因组组装质量。结果表明,该基因组组装质量高,完整性好,且与欧洲林蛙(R. temporaria)的共线性分析也验证了其准确性。
这项研究成果意义非凡。从进化角度来看,高质量的染色体水平基因组为探究牛蛙的进化历程提供了关键线索,有助于理解两栖动物在漫长岁月中的演化轨迹。在功能基因组学方面,丰富的基因注释信息为研究基因功能、调控机制等提供了坚实的数据基础。对于分子育种而言,这一成果更是为培育优良牛蛙品种提供了有力的基因资源,有望提高牛蛙的养殖性能和品质。总之,美国牛蛙染色体水平基因组的成功组装,为相关领域的研究开辟了新的道路,让我们对这种神奇生物的认识和利用上升到了一个新的高度。