揭秘巨蜥体型演化的基因组蓝图:水巨蜥染色体水平高质量基因组发布

《Scientific Data》:Chromosome-scale genome assembly and annotation of the water monitor lizard, Varanus salvator

【字体: 时间:2026年03月06日 来源:Scientific Data 6.9

编辑推荐:

  为了探索脊椎动物体型多样性的演化机制,研究人员利用多组学整合方法,完成了水巨蜥(Varanus salvator)的染色体水平基因组组装。该基因组大小1,645 Mb,支架N50达12.63 Mb,20条假染色体锚定率97.4%,BUSCO评估完整度96.7%,并注释了19,347个蛋白编码基因。这项研究为爬行动物演化、生态适应及保护研究提供了关键资源。

  
动物王国的体型差异巨大,从微小的蜂鸟到庞大的蓝鲸,这种多样性一直是进化生物学家着迷的课题。在众多类群中,巨蜥属(Varanus)的物种展现出了尤为显著的体型变异,从几十厘米长的物种到著名的科摩多巨蜥,使其成为研究脊椎动物体型演化机制的绝佳模型系统。然而,长期以来,缺乏高质量的基因组资源限制了我们从分子层面深入解析其演化奥秘的能力。为了填补这一空白,并为比较基因组学和进化研究提供关键数据,一项聚焦于水巨蜥(Varanus salvator)的研究应运而生。
为了构建这一研究基石,研究人员采用了一套整合的多组学策略。首先,通过高通量测序技术获得原始基因组序列数据。接着,利用Hi-C(高通量染色体构象捕获)技术获取染色质三维空间互作信息,这对于将组装出的序列片段(contigs/scaffolds)正确锚定和排序到染色体水平至关重要。同时,研究还结合了转录组测序(RNA-seq)和同源蛋白比对等多种证据,对基因组中的基因结构进行精准预测和功能注释。评估方面,使用BUSCO(Benchmarking Universal Single-Copy Orthologs)工具来评估基因组组装的完整度,这是一项基于保守单拷贝直系同源基因集的标准评估方法。
基因组组装与评估
研究人员成功构建了水巨蜥的染色体水平基因组。最终组装的基因组大小约为1,645 Mb。在连续性指标上,contig N50达到27.34 Mb,scaffold N50达到12.63 Mb,表明组装具有很高的连续性。通过Hi-C数据,大约97.4%的组装序列被成功锚定到了20条假染色体上,实现了染色体级别的组装。对基因组重复元件的分析显示,约34.0%的基因组序列由各类重复元件构成。使用BUSCO对组装完整性进行评估,结果显示96.7%的保守脊椎动物BUSCO基因是完整的,证明了该基因组组装的高质量。
基因注释与分析
在高质量基因组组装的基础上,研究人员通过整合三种互补方法的证据,共预测出19,347个蛋白质编码基因。随后,利用六个主要的蛋白质数据库对这些预测基因进行功能注释,其中98.8%的基因至少在其中一个数据库中获得了功能注释信息。这为后续的基因功能研究和比较基因组学分析奠定了坚实基础。
本研究成功发布了水巨蜥的高质量染色体水平基因组,其组装连续性高、完整性好,并提供了详尽的基因注释。该基因组揭示了水巨蜥的基因组基本特征,如大小、重复元件比例和基因数量。这一资源具有多重重要意义:首先,它为在巨蜥属乃至更广泛的爬行动物中研究体型大小、生态适应性等复杂性状的进化遗传机制提供了不可或缺的基因组框架。其次,高质量的比较基因组学分析得以开展,有助于揭示爬行动物特有的基因家族扩张、收缩以及关键基因的进化历程。最后,该基因组数据也为水巨蜥这一物种的保护遗传学研究提供了分子层面的依据,支持生物多样性保护工作。此研究成果以数据论文形式发表于《Scientific Data》,标志着爬行类基因组学研究资源的一次重要扩充,将有力推动相关领域的未来探索。
相关新闻
生物通微信公众号
微信
新浪微博

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号