针对高度相似父母致病单倍型的单基因无创产前检测新算法:先天性肾上腺皮质增生症家系的代表性案例
【字体:
大
中
小
】
时间:2025年10月15日
来源:HUMAN MUTATION 3.7
编辑推荐:
本文提出一种新型算法,成功解决了父母致病单倍型高度相似场景下单基因无创产前检测(NIPT)的难题。通过分析特定单倍型上SNP的剂量变化(DC)并规避杂交捕获引入的等位基因偏倚,该研究在先天性肾上腺皮质增生症(CAH)家系中实现了精准的胎儿基因型推断,与侵入性诊断结果一致,为近亲婚配或单倍型高度同源情况提供了创新解决方案。
侵入性产前诊断操作如绒毛膜取样和羊膜穿刺术存在流产或感染风险,且不适用于存在采样禁忌症的患者。近年来,基于单倍型的无创产前检测(NIPT)已在妊娠第七周起广泛应用于单基因隐性遗传病。胎儿循环游离DNA(cfDNA)是单基因NIPT的分析基础,但主要挑战在于其仅占母体cfDNA的少部分,胎儿分数(FF)在妊娠过程中变化且很少高于30%。相对突变剂量(RMD)最初通过测量突变位点的突变型/野生型等位基因比率进行分析,但其常规应用的主要障碍是cfDNA低丰度导致难以从单个基因组位置收集具有统计学意义的分子数。为克服该问题,相邻单核苷酸多态性(SNP)被纳入“单倍型比率”计算,即相对单倍型剂量(RHDO)分析。然而,其对SNP的依赖使其难以应用于近亲家系,因为很少能找到合适的父母SNP组合。本研究接受了一个父母致病单倍型高度相似的先天性肾上腺皮质增生症(CAH)家系。CAH是一组常染色体隐性(AR)遗传病,涉及肾上腺皮质合成皮质醇所需的各种酶的单一基因缺陷。超过95%的CAH病例由21-羟化酶缺乏症(21-OHD, OMIM# 201910)引起,源于细胞色素P450家族21亚家族A成员2(CYP21A2)基因的双等位基因突变。由于信息性SNP匮乏,既往算法未能提供单基因NIPT结果,从而推动了当前方法的改进。
该CAH家系史如图所示。先证者(II-1)被诊断为失盐型CAH并在33天时死亡。父母(I-1和I-2)接受了下一代测序(NGS)和多重连接依赖性探针扩增(MLPA)测试,并通过长读长测序(LRS)验证以克服MLPA在界定精确缺失边界方面的不足。简言之,设计引物扩增CYP21A2、CYP11B1、CYP17A1、HSD3B2和StAR基因。纯化PCR产物后进行定量,随后进行MLPA并构建文库用于LRS。LRS结果显示功能基因TNXB和假基因TNXA的融合断点区间位于chr6:32,042,509–32,043,712(GRCh38/hg38;GRCh37/hg19中为chr:32,010,286–32,011,489),导致跨越CYP21A2外显子1-10的30 kb缺失。
该家系在2017年有另一未患病女儿(II-2)。为明确起见,每位父母的正常和突变等位基因的确定基于家系内的等位基因分离,并通过参考变异的合子性和遗传模式进行确认。具体而言,对未患病孩子(II-2)进行基因分型,发现她在目标位点为纯合参考等位基因,确认其为非携带者。未患病孩子被纳入分析,作为遗传分相的对照,并有助于解析父母单倍型。其基因型为区分疾病相关和非疾病相关单倍型提供了基线,从而提高了分相和变异解读的可信度。鉴于先证者已去世,我们在2022年第三次妊娠期间,获取了妊娠母亲、父亲及其未患病女儿的血样用于单基因NIPT。同时采集羊水样本用于侵入性产前诊断。
设计了一个213.8 kb的捕获panel,利用“基因和跨度SNP选择性富集”(SEGSNP)方法,覆盖CYP21A2外显子和2 Mb基因组范围内的相邻SNP、203个常见SNP(次要等位基因频率(MAF) > 0.45,1000 Genomes Project Phase 3)用于计算FF,以及Y染色体上的35个位点用于胎儿性别鉴定。经过末端修复、条形码接头连接和PCR扩增后,对孕妇cfDNA和家系成员片段化gDNA进行捕获。捕获后文库进行PCR扩增,并在Ion Proton平台上测序。母体cfDNA和其他家系成员gDNA分别分配5M和2M读长。使用TMAP软件将测序读长比对至人类参考基因组(GRCh37/hg19)。去除重复读长后,使用Torrent Variant Caller软件以默认参数识别gDNA的小变异。FF使用父母中基因型不同的同源位点计算,公式为:ff = 2?(a/(a + b)),其中a是胎儿遗传的父亲等位基因的读长深度,b是胎儿与母亲共享的等位基因的读长深度。
随后实施RHDO策略。单倍型分型后,将携带致病变异的母系单倍型指定为HM1,相应的野生型单倍型标记为HM2。类似地,父系致病和野生型单倍型分别分配为HF1和HF2。信息性SNP——定义为一位父母杂合而另一位纯合的位点——分类如下:与HM1/HM2相关的等位基因分类为Type 1/Type 2,与HF1/HF2相关的分类为Type 3/Type 4。Type 1–4中的每一种代表当胎儿遗传母系致病单倍型(HM1)、母系野生型单倍型(HM2)、父系致病单倍型(HF1)或父系野生型单倍型(HF2)时的剂量变化(DC)。采用贝叶斯因子(BF)评估两种假设的概率比:即胎儿遗传HM1/HF1(H1)与HM2/HF2(H2)。公式为BF = p(DCtype1/3 ? DCtype2/4|H1)?/p(DCtype1/3 ? DCtype2/4|H2),其中p表示在H1或H2假设下获得当前DC差异的概率。
初步结果显示Type 1–4的SNP计数分别为227、1、1和212。由于HM1和HF1之间97.97%的同源性,有限的Type 2和Type 3 SNP使BF计算复杂化。因此,我们修改了现有算法,即使仅存在一种信息性SNP类型也能计算BF。这是通过将每种信息性SNP类型进一步细分为typeN_ref和typeN_alt来实现的,基于参考和替代等位基因。通过这种新的分类,type1_ref、type1_alt、type4_ref和type4_alt的计数分别为23、204、1和210。在此修订算法中,用于BF计算的p值不再源自两个单倍型之间的剂量差异,而是基于同一单倍型内ref和alt位点之间的剂量差异。公式表示为BF = p(DCtypeN_ref ? DCtypeN_alt|H1)/p(DCtypeN_ref ? DCtypeN_alt|H2),其中N ∈ {1, 2, 3, 4}。在此上下文中,H1意味着胎儿遗传了与type N对应的父母单倍型,H2则表明胎儿没有遗传。
新算法显示母系type 1 BF为5.4e+10,表明胎儿遗传了母亲的致病单倍型,父系type 4 BF为1e-300,表明胎儿遗传了父亲的野生型单倍型。由于SNP有限,无法获得Type 2和Type 3的BF值。分析表明胎儿为母系致病变异的携带者。这后来通过羊水MLPA得到证实,与单基因NIPT结果一致。2023年3月,母亲生下了一名健康女婴(II-3)。
我们在临床实践中接受了一个父母致病单倍型高度相似的CAH家系。由于信息性SNP不足,既往算法未能提供单基因NIPT结果,从而推动了当前方法的改进。通过新算法分析特定父母单倍型上SNP的剂量变化(DC)来推断胎儿基因型,成功在该家系中实施了单基因NIPT。
超过95%的CAH病例由21-羟化酶缺乏症(21-OHD, OMIM# 201910)引起,源于CYP21A2基因的双等位基因致病变异。通过侵入性操作对高风险家系进行产前诊断会增加流产或感染风险,且不适用于有采样禁忌症的患者。近年来,基于单倍型的NIPT已在妊娠第七周起广泛应用于单基因隐性遗传病。
典型的基于RHDO的分析对致病变异周围的SNP进行分类。例如,Type 1 SNP与HM1相关,而Type 2 SNP对应于HM2。由于父亲对于Type 1和Type 2 SNP总是纯合的,当胎儿遗传HM1时,Type 1 SNP的剂量升高,增加FF的一半。相反,当胎儿遗传HM2时,Type 2 SNP的剂量将上升。诸如序贯概率比检验(SPRT)、隐马尔可夫模型(HMM)和BF等算法被引入基于Type 1和Type 2 SNP的DC推断胎儿基因型。然而,当每位父母拥有高度相似的单倍型时,可能导致特定类型的信息性SNP数量不足。在我们的研究中,父母双方都携带NM_000500.7(CYP21A2): EX1-7缺失变异,并且他们的致病单倍型在致病变异附近高度同源。对于一个Type 2 SNP,假设其在HM2上的等位基因为“a”,其在HM1上的等位基因应为“A”,而HF1和HF2上的等位基因均为“a”。鉴于HF1与HM1高度相似,HM1和HF1之间的大多数等位基因应该相同。这种不一致导致研究案例中仅有一个Type 2 SNP。因此,准确测量Type 2 SNP的DC然后通过RHDO判断是否遗传了HM2变得困难。除单亲二倍体(UPD)等罕见情况外,胎儿将仅遗传HM1或HM2之一。因此,HM2的遗传可以从HM1的遗传中间接推断。这种间接方法适用于SPRT或HMM算法,但在使用BF算法时,挑战出现了,因为它需要从Type 1和Type 2之间的DC差异推断胎儿基因型,因此不允许仅基于Type 1遗传进行计算。
此外,即使对于SPRT和HMM算法,当依赖单一类型的SNP时,它们可能会受到等位基因频率扭曲的影响,特别是由于杂交捕获引入的偏倚。这种技术偏倚源于捕获探针的设计,探针通常基于参考等位基因设计,因此与拥有参考等位基因的DNA模板结合更牢固。结果,参考等位基因比替代等位基因更有效地富集,导致等位基因频率测量出现偏差。这种偏倚在单基因疾病NIPT中尤其成问题,其诊断依赖于检测母体血浆中反映潜在胎儿基因型的细微等位基因频率不平衡。这些不平衡表现出显著的FF依赖性,微小的偏差可能导致错误的诊断呼叫。当前方法主要采用液相杂交捕获来富集致病靶点周围的SNP。然而,由于捕获探针是针对参考基因组设计的,含有参考等位基因的cfDNA片段表现出优先的杂交效率。这种捕获偏倚扭曲了等位基因频率定量,因此损害了重组事件检测,特别是在FF降低的样本中。在我们的案例中,在Type 1位点中,23个是参考等位基因(10.13%),204个是替代等位基因(89.87%)。这种不平衡意味着基于Type 1 SNP的剂量估计可能不成比例地受到捕获偏倚的影响,可能导致胎儿剂量低估和遗传推断错误,特别是关于致病单倍型HM1。
为克服此限制,我们的研究实施了将Type 1–4 SNP细分为参考(ref)和替代(alt)亚型。随后计算参考等位基因频率系统地最小化了探针设计引起的偏倚。每种SNP类型根据其在各自父母单倍型中的等位基因进一步分为typeN_ref和typeN_alt。例如,对于Type 1 SNP,如果胎儿遗传HM1,type1_ref的参考等位基因频率增加FF/2,而type1_alt则下降相同幅度(意味着替代等位基因的频率上升)。type1_ref和type1_alt之间预期的参考等位基因频率差异为FF。当胎儿遗传HM2时,两种类型的等位基因频率保持不变,预期参考等位基因频率差异为零。这种方法仅关注参考等位基因频率,有效规避了DNA杂交引起的等位基因偏倚。通过上述分类调整,BF算法的重点从测量Type 1和Type 2 SNP之间的DC差异转变为计算type1_ref和type1_alt之间的参考等位基因DC差异,确保了即使在仅有一种信息性SNP的场景下也能兼容。最终,根据这些算法修改,我们成功确定胎儿遗传了HM1,与侵入性产前诊断结果一致。
足够的信息性SNP代表是靶向NIPT的基本要求。在等位基因缺失的临床场景中——例如近亲联姻或奠基者群体——传统的单基因NIPT方法经常产生无结果呼叫或诊断错误。为克服此限制,我们开发了一种单倍型优化策略,涉及将亚型分层为参考(ref)和替代(alt)等位基因变异。随后量化这些亚型之间的相对剂量差异能够进行可靠的诊断解读。此方法学进步有效缓解了源于单倍型特异性SNP不足的分析限制。该方法也适用于其他基于单倍型的NIPT,用于AR、常染色体显性(AD)和X连锁隐性(XR)疾病。然而,实施仍取决于目标单倍型内足够的信息性SNP数量以及足够的ref和alt等位基因。
总之,我们通过改进当前算法,成功在一个父母致病单倍型高度相似的CAH家系中实施了单基因NIPT。理论上,该算法可应用于解决其他情况,如近亲婚配和信息性SNP不足,进一步扩展了基于单倍型的NIPT的应用领域。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号