
-
生物通官微
陪你抓住生命科技
跳动的脉搏
濒危物种驼背鱼(Cheilinus undulatus)首个端粒到端粒无间隙基因组组装揭示其性转变与生态保护的分子基础
【字体: 大 中 小 】 时间:2025年07月12日 来源:Scientific Data 5.8
编辑推荐:
本研究针对濒危珊瑚礁鱼类驼背鱼基因组不完整问题,整合PacBio HiFi、ONT Ultra-long和Hi-C测序技术,首次构建了高质量端粒到端粒(T2T)无间隙基因组(1.25Gb),完成24条染色体48个端粒和24个着丝粒定位,注释26,609个蛋白编码基因。该成果为解析其性转变机制、种群遗传保护及珊瑚礁生态系统研究提供了关键基因组资源。
珊瑚礁生态系统的"建筑师"驼背鱼(Cheilinus undulatus)正面临严峻生存危机。这种体型硕大、寿命超过30年的濒危鱼类,不仅是珊瑚礁生态平衡的关键物种,还具有罕见的雌性先熟性转变现象——个体在5-7岁性成熟为雌性后,会在8-9岁时转变为雄性。然而,过度捕捞、栖息地破坏和气候变化导致其种群数量锐减,被IUCN列为濒危物种。更棘手的是,此前发布的驼背鱼基因组存在大量缺口和片段丢失,严重阻碍了对其性转变分子机制和种群遗传特征的研究。
深圳大学水生基因组学实验室联合广东省农业技术推广中心等机构的研究人员,在《Scientific Data》发表了突破性研究成果。通过整合三代测序技术优势:PacBio HiFi提供高精度长读长(平均19.07kb)、ONT超长读长(平均96.15kb)弥补复杂区域覆盖,结合Hi-C染色体构象捕获技术,成功构建了首个驼背鱼T2T无间隙基因组。研究选用广东惠州海洋渔业实验中心的成年个体,采集肌肉组织进行全基因组测序,并取10种组织进行转录组辅助注释。
关键技术包括:(1)采用K-mer分析估算基因组大小(1.17Gb)和杂合率(0.27%);(2)HiFiasm整合三代数据获得初始组装后,用T2T-polish进行抛光;(3)3D-DNA结合Hi-C数据将contig锚定至24条染色体;(4)Centromics软件定位着丝粒区域;(5)多策略联合注释重复序列(占基因组52.63%)和蛋白编码基因。
基因组组装与质量评估
最终获得的1.25Gb基因组包含24条染色体,contig N50达54.51Mb,所有序列缺口均被封闭。BUSCO评估显示99.3%的脊椎动物保守基因完整,Merqury计算的组装质量值(QV)为53.447。与旧版基因组比较显示良好共线性,证实组装准确性。

染色体特征解析
首次精确定位所有端粒(TTAGGG/CCCTAA重复序列)和着丝粒位置(表1)。着丝粒呈现显著GC含量波动,如Chr1着丝粒区跨度561.5kb(4.03-4.59Mb)。Circos图可视化显示基因密度与转座子分布呈负相关,串联重复序列在端粒区域富集。
功能注释新发现
预测的26,609个基因中98.9%获得功能注释,包括2,221个rRNA、3,020个tRNA和781个miRNA。特别值得注意的是,与视觉相关的视蛋白基因家族呈现显著扩张,这与其珊瑚礁栖息环境的光适应需求相符。

这项研究创建的"无死角"基因组填补了驼背鱼分子生态学研究的工具空白。其科学价值体现在三方面:首先,为解析性转变相关基因(如SF-1、FOXL2)的调控网络提供精确基因组坐标;其次,高精度着丝粒图谱助力研究其在种群分化中的角色;最后,视蛋白基因集的完整注释为珊瑚礁鱼类感官进化研究树立新标准。该基因组已被CNGBdb(CRA023609)和GenBank(JBMUSF010000000)收录,将成为保护这一濒危物种的关键遗传资源。
生物通微信公众号
知名企业招聘