基于gnomAD v4数据库的80万例样本分析揭示临床相关变异的外显率机制

《Nature Communications》:Exploring penetrance of clinically relevant variants in over 800,000 humans from the Genome Aggregation Database

【字体: 时间:2025年11月01日 来源:Nature Communications 15.7

编辑推荐:

  本研究针对变异解读中的不完全外显难题,利用gnomAD v4数据库807,162例样本开展临床变异分析。通过对77个单倍体不足基因的734个预测功能缺失(pLoF)变异进行深度评估,发现95%的变异可通过注释优化、体细胞变异等机制解释其耐受性。该研究建立了系统的pLoF评估框架,为精准医学中的变异解读提供了重要依据。

  
在精准医疗时代,基因检测已成为疾病诊断和风险预测的重要工具。然而临床实践中经常遇到令人困惑的现象:健康个体携带的某些基因变异,按照现有知识判断本应导致严重疾病,但携带者却表现正常。这种不完全外显(incomplete penetrance)现象成为变异解读的主要挑战之一。随着大规模人群基因组数据库的出现,研究人员开始系统探索这一现象的遗传基础。
近日发表于《Nature Communications》的研究中,由Sanna Gudmundsson和Anne O'Donnell-Luria领导的团队利用基因组聚集数据库(Genome Aggregation Database,gnomAD)v4版本的807,162例样本,开展了迄今为止最全面的临床相关变异外显率分析。研究特别聚焦于77个与严重、早发性、高外显单倍体不足(haploinsufficient)疾病相关基因中的预测功能缺失(predicted loss-of-function,pLoF)变异。
为探究不完全外显的机制,研究人员采用多维度分析策略。首先评估了ClinVar数据库中临床相关变异在gnomAD v4中的分布特征,随后重点对734个pLoF变异进行个案深度评估,建立系统的功能缺失变异评估框架。
关键技术方法包括:利用gnomAD v4数据库的807,162例样本(76,215个基因组和730,947个外显子组)进行变异频率分析;基于LOFTEE(Loss-Of-Function Transcript Effect Estimator)工具鉴定高置信度pLoF变异;应用32条规则的评估框架对pLoF变异进行功能影响分类;整合GTEx数据的剪接数量性状位点(splicing quantitative trait loci,sQTL)分析和每碱基表达评分(per-base expression score,pext)评估。
结果
gnomAD v4中ClinVar变异的代表性提升
分析显示,gnomAD v4包含了ClinVar中73.6%的变异,其中致病/可能致病(pathogenic/likely pathogenic,P/LP)变异的代表性从v2的16.3%提升至v2的30.0%。绝大多数(97.6%)P/LP变异等位基因频率(allele frequency,AF)低于0.01%,且主要存在于常染色体隐性(autosomal recessive,AR)遗传病相关基因中,与预期一致。
遗传祖先群特异性不完全外显案例
研究发现一个典型的祖先群特异性不完全外显案例:GJB2基因的p.Gly45Glu变异本应导致致死性角膜炎-鱼鳞病-耳聋综合征(keratitis-ichthyosis-deafness syndrome,KID),但在gnomAD的35例个体中出现。进一步分析发现,所有携带者同时具有下游的无义变异p.Tyr136Ter,且两个变异呈顺式排列。这种单倍型在东亚祖先群中特异性富集,表明p.Tyr136Ter通过将显性负效应转化为功能缺失而起到保护作用。
显性遗传病相关pLoF变异的高拯救率
针对77个单倍体不足基因中的734个高置信度pLoF变异,研究人员进行了深入评估。结果显示,95%的变异(701/734)的不完全外显可得到解释,仅4.5%的变异(33/734)原因不明。最常见的拯救机制包括:位于最后一个外显子或倒数第二个外显子的最后50个碱基对(18%)、低pext评分区域(10.8%)、附近次级变异拯救(7.8%)以及体细胞起源(5.7%)。
非编码sQTL介导的选择性剪接导致的不完全外显
研究发现9个pLoF变异位于sQTL介导的选择性剪接区域。以MEF2C基因为例,该区域pLoF变异在gnomAD和ClinVar中聚集出现,且与降低的pext评分相关,提示该区域变异可能通过选择性剪接导致不完全外显或存在错误分类。
讨论与结论
本研究通过大规模系统分析,揭示了人群中临床相关变异不完全外显的多种机制。大多数看似不完全外显的pLoF变异实际上可通过现有注释框架、体细胞变异或技术假象解释。研究建立的精细化pLoF评估框架显著降低了假阳性率,对临床变异解读具有重要指导意义。
特别值得注意的是,研究强调了深度个案评估的必要性。标准高通量分析流程容易过度解读严重疾病相关pLoF变异的致病性,尤其在未受影响的个体中假阳性率较高。研究还揭示了遗传祖先群特异性单倍型在修饰变异外显率中的作用,凸显了人群数据库多样性的重要性。
此外,研究证实pext评分和sQTL分析是识别潜在不完全外显区域的有效工具。MEF2C等基因中pLoF变异的非随机分布提示自然选择可能作用于减少致病变异转录本包含的单倍型配置。
这项研究为理解变异外显率的分子机制提供了重要见解,建立的评估方法可直接应用于临床变异解读流程。随着更多样化测序数据的积累,特别是来自代表性不足群体的数据,未来有望发现更多影响外显率的遗传修饰因子,最终实现更精准的疾病风险预测。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号