近着丝粒至端粒单倍型基因组:湄公河重要经济鱼类Hypsebarbus vernayi的高质量参考基因组解析
《Scientific Data》:The haplotype-resolved and near telomere-to-telomere genome assembly for Hypsebarbus vernayi
【字体:
大
中
小
】
时间:2025年12月03日
来源:Scientific Data 6.9
编辑推荐:
本研究针对湄公河流域重要经济鱼类Hypsibarbus vernayi缺乏高质量基因组的问题,利用PacBio HiFi、Oxford Nanopore和Hi-C技术成功构建了该物种的单倍型解析近T2T基因组。两个单倍型基因组大小分别为709 Mb和707 Mb,支架N50达27.8/26.8 Mb,仅含8个缺口,其中31条染色体实现两端端粒组装。研究发现262-bp卫星DNA为着丝粒重复序列,注释获得24,172-24,919个蛋白编码基因。该基因组为鱼类远缘杂交育种和进化研究提供了重要资源。
在鱼类基因组学研究飞速发展的今天,高质量参考基因组的缺乏仍是制约许多经济鱼类遗传育种研究的关键瓶颈。湄公河流域的重要食用鱼类Hypsibarbus vernayi(2n=50)作为当地潜在的水产养殖新品种,其基因组资源的缺失严重阻碍了分子育种进程。随着长读长测序技术的突破,着丝粒至端粒(Telomere-to-Telomere, T2T)和单倍型解析(haplotype-resolved)基因组已成为基因组学研究的新标准,为解析基因组复杂区域(如着丝粒、串联重复序列等)提供了全新视角。然而,非灵长类脊椎动物中此类高质量基因组仍较为稀缺。
为解决这一科学问题,由王治邦、高瑜等研究人员组成的团队在《Scientific Data》发表了题为《The haplotype-resolved and near telomere-to-telomere genome assembly for Hypsebarbus vernayi》的研究论文。该研究整合PacBio HiFi(110.9 Gb)、Oxford Nanopore(38.2 Gb)和Hi-C(250.6 Gb)三种测序技术,成功构建了H. vernayi的单倍型解析近T2T基因组。研究样本采自云南农业大学提供的雄性个体,通过肌肉组织提取基因组DNA,采用标准酚氯仿法进行核酸提取。
关键技术方法包括:使用hifiasm(v0.19.9)进行基因组初步组装,通过Juicer和3D-DNA流程进行Hi-C辅助染色体挂载,利用BRAKER3整合RNA-seq和同源蛋白数据进行基因注释,采用PyTandemFinder和quarTeT分别鉴定着丝粒和端粒重复序列,并运用SyRI进行单倍型间结构变异分析。
研究获得的两个单倍型基因组大小分别为709.57 Mb和707.79 Mb,支架N50达到27.89 Mb和26.83 Mb,仅包含8个缺口(单倍型1有1个,单倍型2有7个)。BUSCO评估显示完整性分别为99.0%和99.1%,Merqury评估的QV值分别为64.4和66.3,准确率超过99.99%。通过Hi-C数据,99.37%和99.69%的序列成功锚定到25条染色体上,与细胞遗传学研究的染色体数目一致。
重复序列注释显示,两个单倍型中转座元件(Transposable Elements)占比分别为40.79%和40.26%,其中DNA转座子为主要成分(约35%)。通过BRAKER3流程注释获得24,172-24,919个蛋白编码基因,与近缘种Onychostoma macrolepis的基因数量相当。
研究鉴定出一个262-bp卫星DNA序列(CEN262)作为主要着丝粒重复序列。该序列在大多数染色体上呈现单一分布模式,且分布区域与低基因密度、低转座元件密度和低DNA甲基化水平特征相符。端粒分析发现,第一个单倍型中41个端粒被成功组装(12条染色体两端完整),第二个单倍型中43个端粒被组装(19条染色体两端完整)。
SyRI分析显示两个单倍型间存在约660 Mb的共线性区域(占基因组93%),倒位区域约占0.069%(约0.4 Mb),易位区域占1%(约7.5 Mb)。未比对区域主要位于着丝粒附近,与着丝粒重复序列的分布特征一致。
该研究成功构建了H. vernayi的高质量单倍型解析近T2T基因组,为理解鱼类基因组结构和进化提供了重要资源。着丝粒重复序列CEN262的鉴定为研究染色体进化机制提供了新线索。基因组中仅存少量缺口和高度完整的端粒组装,使其成为鱼类基因组研究的重要参考。这些发现将显著促进湄公河流域经济鱼类的遗传育种工作,为鱼类远缘杂交育种提供分子基础。所有数据已公开存储于NCBI(SRP596338)和欧洲核苷酸档案库(GCA_977016905.2),为后续比较基因组学和功能基因组学研究奠定了坚实基础。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号