
-
生物通官微
陪你抓住生命科技
跳动的脉搏
濒危山地大猩猩首例近端粒到端粒单倍型 phased 参考基因组组装揭示进化与保护新资源
【字体: 大 中 小 】 时间:2025年05月23日 来源:Scientific Data 5.8
编辑推荐:
为解决濒危物种山地大猩猩(Gorilla beringei beringei)缺乏高质量基因组资源的难题,研究人员通过PacBio HiFi(26.77x)和ONT(52.87x)长读长测序技术,构建了首个近端粒到端粒(T2T)单倍型phased参考基因组。该组装contig N50达95 Mbp,QV为65.15(错误率3.1×10-7),BUSCO完整度98.4%,显著优于现有灵长类基因组。这一成果为解析大猩猩高海拔适应、种群历史和疾病易感性提供了关键工具,对濒危物种保护具有里程碑意义。
山地大猩猩(Gorilla beringei beringei)作为东部大猩猩的濒危亚种,仅存约1,063只野生个体,栖息在卢旺达、乌干达和刚果的高海拔森林中。尽管与人类共享98%的基因组相似性,其独特的适应机制(如低氧环境生存)和种群衰退的遗传基础长期缺乏高质量基因组支持。此前研究多依赖低地大猩猩基因组进行比对,导致适应性研究和保护策略制定存在显著局限。
为解决这一难题,由纽约大学阿布扎比分校、列日大学等机构组成的国际团队,利用濒危个体“Igicumbi”的血液样本,通过PacBio HiFi(平均覆盖26.77x)和ONT超长读长(52.87x)测序技术,结合hifiasm算法,成功构建了首个近端粒到端粒(Telomere-to-Telomere, T2T)单倍型phased参考基因组。该成果发表于《Scientific Data》,填补了灵长类基因组资源的重大空白。
关键技术方法
研究团队从麻醉处理的幼年雄性大猩猩采集20 mL EDTA抗凝血,通过Percoll?梯度离心分离PBMCs,采用NucleoBond HMW和Monarch HMW试剂盒提取高分子量DNA。测序使用PacBio Sequel IIe(HiFi模式,N50 16.3 kbp,Q30占比63.8%)和PromethION 2(ONT超长读长N50 29.5 kbp),经hifiasm(v0.19.8-r603)进行单倍型分型组装,辅以Merqury(k-mer分析)、BUSCO(v5.7.0)和QUAST进行质量评估。
研究结果
背景与摘要
组装结果显示:合并伪单倍型基因组大小3.54 Gbp,contig N50达95 Mbp,单倍型Hap1(3.1 Gbp)和Hap2(3.2 Gbp)的N50分别为56.5 Mbp和51.0 Mbp。与T2T大猩猩参考基因组(Gorilla gorilla)比对显示,90%染色体区域仅需2个contigs覆盖,证实组装高度连续。
基因组质量评估
Merqury分析显示单倍型QV>65(错误率<3.1×10-7),BUSCO完整度达98.4%(单拷贝97.2%)。ONT读长比对率96.8%(平均一致性95.4%),HiFi读长99.4%一致性,验证了组装的高精度。
重复元件与基因注释
RepeatMasker分析揭示34.8%基因组为重复序列,其中LINEs(14.06%)和SINEs(7.70%)占比最高。HiTE工具鉴定出全长转座子,可能参与高海拔适应的基因调控。通过SNAP和TransDecoder预测的编码序列为功能研究奠定基础。
讨论与意义
该基因组首次完整呈现了山地大猩猩的染色体结构,包括着丝粒和端粒区域。相比Illumina短读长组装(N50 55 kbp),其连续性提升超1,700倍,为解析种群瓶颈(如近交系数上升)提供了新视角。研究还发现X染色体覆盖度(90.38%)显著高于Y染色体(53.9%),暗示性染色体演化差异。
此资源将推动三大领域研究:1)通过比较基因组学揭示大猩猩与人类分化后的适应性突变;2)鉴定疾病相关基因(如呼吸道感染易感性);3)指导保护区的遗传多样性管理。未来结合更多个体测序,可构建种群特异性变异图谱,为这一濒危物种的长期生存提供科学依据。
生物通微信公众号
知名企业招聘