人类基因组计划的超越:从端粒到端粒的完整基因组时代与泛基因组参考框架的革命性意义

【字体: 时间:2025年08月13日 来源:Annual Review of Genomics and Human Genetics 7.9

编辑推荐:

  这篇综述系统阐述了人类基因组研究从HGP(Human Genome Project)到T2T(Telomere-to-Telomere)完整基因组和HPRC(Human Pangenome Reference Consortium)泛基因组参考的跨越式发展。文章详述了长读长测序技术(PacBio HiFi/ONT)和组装算法如何破解着丝粒、端粒等复杂区域,并强调泛基因组对精准医疗(precision medicine)、群体遗传学和疾病关联研究的变革性影响,为基因组学领域提供了全新范式。

  

1. 引言:基因组学的范式转变

人类基因组计划(HGP)虽构建了GRCh38参考基因组,但仍有近200Mbp缺口,尤其是着丝粒、端粒和节段重复区域(segmental duplications, SDs)。端粒到端粒联盟(T2T Consortium)利用PacBio HiFi(>99.9%准确度)和牛津纳米孔(ONT)超长读长技术(100kbp-1Mbp),首次完成CHM13细胞系T2T-CHM13v2.0组装,填补全部缺口并纠正GRCh38中30Mbp错误序列。与此同时,人类泛基因组参考联盟(HPRC)通过47个全球多样性样本的组装,新增119Mbp多态性序列和1,115个基因拷贝数变异,标志着基因组分析从单一线性参考迈向多元泛基因组时代。

2. 完整基因组参考序列的突破性价值

T2T-CHM13显著提升短读长(Illumina)和长读长数据的比对效率:

  • 短读长分析:新增19Mbp可唯一比对区域,1000基因组计划样本中检出更多真实变异,减少假阳性(如KCNJ18基因的节段重复错误被修正)。

  • 长读长优势:82Mbp独特序列通过1kbp片段唯一比对,17个样本分析显示比对错误率降低且覆盖更均匀。

  • 功能基因组学:首次实现着丝粒卫星DNA(CenSat)和rDNA阵列的表观遗传分析,揭示这些“暗物质”区域与疾病和进化的关联。

3. 从单个T2T基因组到群体规模组装

自动化工具Verkko和hifiasm-UL整合HiFi(>60×覆盖度)、ONT(>30×)和Hi-C数据,实现日均完成1个人类基因组组装。典型案例包括:

  • Y染色体突破:T2T-CHM13v2.0新增30Mbp序列,解析41个蛋白编码基因,揭示男性特有区域的结构多态性。

  • 跨物种应用:黑猩猩、拟南芥等物种的T2T组装证实该技术普适性,为比较基因组学提供新工具。

4. 泛基因组构建的科学与伦理维度

HPRC泛基因组包含三大核心要素:

  • 组装(Assemblies):47个近T2T样本的700单倍型,新增90Mbp结构变异(SV)序列,如CYP2D6/7基因簇的复杂单倍型(图3)。

  • 样本选择算法:优先覆盖非洲人群的高杂合度变异,同时通过社区参与保障伦理合规性(如防止科学种族主义)。

  • 构建挑战:Minigraph-Cactus方法平衡参考序列一致性与变异包容性,但高度重复区域(如VNTR)的比对仍是难点。

5. 泛基因组学的多领域应用

  • 疾病研究:在LPA基因中发现与冠心病相关的KIV-2拷贝数变异,中国泛基因组联盟鉴定1,575个汉族特有序列关联精神疾病。

  • 农业与进化:番茄泛基因组指导抗病育种,草莓泛基因组揭示转座子在物种形成中的作用。

  • 技术瓶颈:现有工具(如vg、odgi)需优化以支持百万级样本分析,祖先重组图(ARG)或可提升复杂区域单倍型解析精度。

6. 未来方向:从基础研究到临床转化

TOPMed和“全民健康计划”(All of Us)正整合泛基因组与百万级群体数据,但需解决:

  • 计算瓶颈:GFA格式的存储效率、VCF对图结构的兼容性不足。

  • 临床落地:基于泛基因组的GWAS已发现346个VNTR表达数量性状位点(eQTL),但非欧人群数据匮乏仍是精准医疗的短板。

    这场基因组学革命正推动从“单一参考”到“多元全景”的认知升级,其影响将贯穿基础研究至临床实践每个环节。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号