染色体级别基因组组装揭示金沙江流域特有鱼类 Lepturichthys fimbriata 的生态适应机制

《Scientific Data》:Chromosome-level genome assembly of the Lepturichthys fimbriata

【字体: 时间:2025年11月29日 来源:Scientific Data 6.9

编辑推荐:

  本研究针对金沙江流域特有底栖鱼类 Lepturichthys fimbriata 缺乏完整核基因组资源的现状,通过整合 PacBio HiFi、Illumina 和 Hi-C 测序技术,成功构建了首个染色体级别的基因组图谱。该基因组大小为 591 Mb,scaffold N50 达 20.9 Mb,94.2%序列锚定至 25 条伪染色体,注释获得 21,320 个蛋白编码基因。BUSCO 评估完整度达 97.3%,为研究该物种的遗传多样性和生态适应机制提供了关键资源。

  
在金沙江湍急的岩石浅滩中,生活着一种特殊的小型底栖鱼类——Lepturichthys fimbriata(缨唇犁头鳅)。这种鱼类凭借其宽阔扁平的偶鳍和裸露的胸腹部,能够牢牢附着在急流中的砾石表面,用角质化的锋利下颌刮食附着藻类和小型无脊椎动物。然而,随着长江流域水利工程的快速发展,特别是缺乏过鱼设施的三峡大坝和葛洲坝等大型水坝的修建,严重破坏了 L. fimbriata 的栖息地和繁殖通道,使这一特有物种面临生存威胁。
尽管先前研究已获得该物种的线粒体序列和微卫星标记数据,但完整的核基因组资源始终缺失。基因组资源的匮乏限制了对该物种适应性进化机制的深入解析。随着高通量测序技术的进步,特别是单分子实时测序技术的发展,为鱼类基因组学研究提供了新的机遇。在此背景下,研究人员开展了 L. fimbriata 染色体级别基因组的组装与注释工作,相关成果发表于《Scientific Data》期刊。
研究团队采用多技术整合策略,主要关键技术包括:基于17-mer频率分析估计基因组大小(556 Mb);使用PacBio HiFi长读长数据进行初步组装,并通过hifiasm软件进行优化;利用Hi-C技术将94.2%的序列锚定至25条伪染色体;结合de novo预测、同源比对和转录组证据进行基因注释。样本来源于金沙江流域采集的成年个体,肌肉组织用于基因组测序,肝脏、鳍、心脏和眼组织用于RNA测序。
基因组大小估计和de novo组装
通过Illumina短读长数据的17-mer分析,估计L. fimbriata基因组大小为556 Mb。使用hifiasm软件对HiFi长读长进行初步组装,经过SMRT Link gcpp和三轮Racon抛光处理,再通过Purge_haplotigs优化去除冗余序列。最终获得591 Mb的基因组组装结果,scaffold N50为20.9 Mb。
L. fimbriata基因组中的重复元件和蛋白编码基因注释
重复序列注释通过整合de novo重复库构建和数据库搜索完成。分析显示重复序列总长为212.72 Mb,占基因组的36.01%,其中DNA转座子占比最高(9.62%),其次为LINE反转录转座子(6.94%)、LTR(6.34%)和SINE(0.46%)。基因注释采用EvidenceModeler整合多种证据来源,最终预测出21,320个蛋白编码基因,其中95.65%的基因获得至少一种功能注释。
技术验证
通过BUSCO评估基因组组装质量,以actinopterygii核心基因集为参考,完整度达到97.3%。与Gymnocypris eckloni(87.5%)和Beaufortia pingi(97.0%)的比较显示L. fimbriata基因组组装质量优异。Illumina短读长和HiFi长读长比对率分别达到99.48%和99.92%,进一步验证了组装的准确性。
该研究成功构建了L. fimbriata的高质量染色体级别基因组,为理解这一特有鱼类的遗传特性和生态适应机制奠定了重要基础。基因组数据的公开将促进对该物种资源保护、遗传选育和生态适应研究的深入开展,为长江流域水生生物多样性保护提供科学依据。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号