日本人群特异性参考基因组JG2发布:大幅提升基因组覆盖度与变异检测精度的更新版本
【字体:
大
中
小
】
时间:2025年10月02日
来源:Human Genome Variation 1.3
编辑推荐:
为解决日本人群遗传变异精准解析的瓶颈,研究团队基于Hi-C测序与相位组装技术,对JG1参考基因组进行系统性升级,构建了染色体级别的JG2参考基因组。新版本涵盖3,115,695个变异位点(其中298,644个在3.5KJPNv2面板中AF=1.0),N50提升至152,668,378 bp,显著增强了对日本人群特异变异的代表性。该成果为东亚人群遗传研究提供了高精度资源,发表于《Human Genome Variation》。
尽管人类参考基因组GRCh38和T2T-CHM13为全球遗传研究提供了重要基础,但不同人群特有的遗传变异仍难以被标准参考基因组全面捕获。尤其是日本人群,其基因组中存在大量群体特异性单核苷酸变异(SNV)、短插入缺失(indel)和结构变异,而基于欧美人群构建的参考基因组可能导致变异检测偏差。此前开发的JG1参考基因组虽初步解决了这一问题,但仍存在序列不完整、注释有限以及对日本主流变异代表性不足等缺陷。
为了突破这些限制,日本东北大学的研究团队在《Human Genome Variation》发表了JG2——一个全新升级的日本人群特异性参考基因组。JG2基于与JG1相同的三名日本男性志愿者(jg1a、jg1b、jg1c)的数据,但通过引入Hi-C测序、相位感知组装和多重meta-assembly策略,实现了基因组连续性、单倍型分辨率和变异代表性的显著提升。
利用PacBio RS II长读长测序数据,通过FALCON、FALCON-unzip和FALCON-Phase进行相位组装,生成每个个体的两个单倍型组装结果;使用Hi-C数据(Mbol和HindIII酶切)进行染色质构象辅助 scaffolding,提升组装连续性和准确性;整合Bionano光学图谱与Oxford Nanopore长读长数据,通过SALSA2和Metassembler进行混合scaffolding与meta-assembly;基于3.5KJPNv2等位基因频率面板,采用多数等位基因决策策略,剔除稀有变异,增强群体代表性;利用遗传图谱和辐射杂交图谱进行染色体锚定,保证组装独立性。
基因组组装与质量评估
JG2最终包含22条常染色体、X和Y染色体、1条线粒体染色体及1148条未定位支架,总长度约3.1 Gb。 scaffold N50达到152,668,378 bp,较JG1(141,953,703 bp)显著提升。与GRCh38相比,JG2覆盖其91.11%序列且平均一致性达99.80%。 intentional gap(端粒、着丝粒和异染色质区域)占总gap的93%,表明复杂区域被系统标注而非忽略。
变异代表性分析
JG2携带3,115,695个变异位点,其中298,644个SNV在3.5KJPNv2面板中的等位基因频率(AF)为1.0,即全部日本个体在这些位点均与JG2一致。这一数字显著高于JG1(246,464),证明JG2更好地代表了日本人群的主要等位基因谱。此外,AF≥0.99和≥0.90的位点分别达366,364和624,847个。
实际应用验证
使用104名JPT(1000基因组计划中的日本东京样本)的全基因组数据,以JG2和GRCh38分别作为参考进行变异检测。结果显示,JG2作为参考时检测到的SNV(平均2,920,870)和indel(平均771,343)数量均低于GRCh38(SNV: 3,772,565;indel: 862,144),表明JG2减少了由于参考基因组偏差导致的假阳性变异调用。
JG2通过相位组装和多重整合策略,实现了对日本人群基因组的高分辨率解析。其核心进步在于:单倍型分辨率的引入使个体变异得以准确表征;meta-assembly策略整合了最优局部序列,提升组装完整度;等位基因频率导向的筛选确保了参考基因组的群体代表性。尽管JG2在端粒和着丝粒区域仍依赖N占位符,未达到T2T联盟的完整度,但其作为人群特异性参考基因组的实用性和准确性已得到充分验证。该资源将通过jMorp平台开放访问,为日本及东亚人群的遗传病研究、群体进化分析和精准医学实践提供关键基础设施。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号