
-
生物通官微
陪你抓住生命科技
跳动的脉搏
岩原鲤(Procypris rabaudi)端粒到端粒(T2T)全基因组组装与注释:为长江上游珍稀经济鱼类保护与育种提供高质量基因组资源
【字体: 大 中 小 】 时间:2025年05月14日 来源:Scientific Data 5.8
编辑推荐:
本研究针对长江上游珍稀经济鱼类岩原鲤(Procypris rabaudi)基因组资源匮乏的问题,通过整合PacBio HiFi、ONT超长读长和Hi-C技术,首次完成其1.64Gb的端粒到端粒(T2T)无间隙基因组组装,构建50条伪染色体并注释44,402个功能基因,BUSCO完整性达98.1%。该研究为岩原鲤多倍体基因组进化分析、种质资源保护及分子育种提供了关键数据支撑,成果发表于《Scientific Data》。
岩原鲤(Procypris rabaudi)作为长江上游特有的重要经济鱼类,近半个世纪以来因环境污染、过度捕捞等因素导致种群数量锐减,被列为中国国家二级重点保护野生动物。尽管已有21种鲤科鱼类基因组被解析,但岩原鲤作为四倍体物种,其复杂基因组结构仍缺乏高质量参考序列,制约了其进化研究、疾病抗性基因挖掘及人工增殖放流效果评估。
西南大学渔业学院的研究团队通过采集重庆养殖场的岩原鲤样本,联合PacBio Sequel II平台HiFi长读长(53.2Gb,N50 19.11kb)、ONT超长读长(20.21Gb,N50 100kb)和Illumina Hi-C数据(142.59Gb),采用HiFiasm(v0.16.0)进行初步组装后,利用3D-DNA和JuiceBox(v1.11.08)构建50条伪染色体,最终获得1.64Gb的T2T基因组,其中43条染色体实现完全无间隙组装。通过整合同源预测与RNA-seq技术,鉴定出44,402个蛋白质编码基因,功能注释率达98.3%。
基因组组装与质量评估
研究团队采用TGS-GapCloser进行三次校正后,基因组contig N50提升至32.36Mb,Hi-C数据将99.83%序列锚定至伪染色体。quarTeT(v1.1.4)分析显示端粒TTAGGG/CCCTAA重复序列及着丝粒区域分布特征,为染色体结构研究奠定基础。
重复序列分析
通过RepeatModeler和LTR-FINDER_parallel(v1.0.7)鉴定出占基因组46.9%的重复序列,其中DNA转座元件(28.73%)、LINE(6.09%)和LTR(6.04%)为主要类型,卫星序列占2.45%,反映四倍体基因组的重复序列扩张特征。
基因功能注释
MAKER2和HiFAP流程整合的基因集显示平均基因长度18.3kb,含10.13个外显子。与鲤(Cyprinus carpio)、银鲫(Carassius gibelio)等近缘物种比较基因组分析揭示保守基因结构。InterProScan(v5.61-93.0)注释显示93.38%基因具有功能域,KEGG通路注释率达97.23%。
非编码RNA鉴定
tRNAscan-SE(v1.3.1)预测8,977个tRNA基因,Rfam数据库鉴定出3,969个miRNA和6,614个snRNA,其中剪接相关snRNA占比达90.7%,为转录调控研究提供线索。
该研究构建的岩原鲤T2T基因组填补了鲤科鱼类四倍体基因组研究的空白,其98.1%的BUSCO完整性和43条完全组装染色体为解析多倍化事件后的亚基因组分化机制提供了理想模型。基因组中鉴定的着丝粒和端粒特征序列,以及28.73%的DNA转座元件含量,为研究鱼类基因组稳定性进化提供了新视角。研究成果不仅支撑长江上游珍稀鱼类种质资源保护,更为经济鱼类抗病育种和性别决定机制研究奠定了分子基础,对实现渔业资源可持续利用具有重要实践意义。
生物通微信公众号
知名企业招聘