HiFi揭秘串联重复病理性扩增之谜

【字体: 时间:2023年08月09日 来源:基因有限公司

编辑推荐:

  近日,发表在bioRxiv题为“A common flanking variant is associated with enhanced meiotic stability of the FGF14-SCA27B locus”的研究提出了驱动串联重复序列病理性扩增因素的新思路。

前情提要

成纤维细胞生长因子14 (fibroblast growth factor 14,FGF14)基因内含子1中显性遗传的(GAA)•(TTC)重复扩增最近被证明可引起脊髓小脑性共济失调27B (SCA27B) 。初步观察表明,扩增的等位基因在遗传过程中是不稳定的,但是导致这种不稳定的潜在机制尚不清楚。

文献速递

近日,发表在bioRxiv题为“A common flanking variant is associated with enhanced meiotic stability of the FGF14-SCA27B locus”的研究提出了驱动串联重复序列病理性扩增因素的新思路。

image002.jpg

研究人员通过PacBio HiFi长读长测序和Sanger测序对2,530个个体的FGF14-SCA27B (GAA)•(TTC)重复位点进行了评估,并在70.34%的等位基因(3,463/4,923)中发现了FGF14重复位点5'端17 bp的InDel。这种常见的5'端序列变异几乎只存在于少于30个纯GAA重复的等位基因上并且与重复位点的减数分裂稳定性增强有关。该变异将短等位基因(<30个GAA重复)与长等位基因(>30个GAA重复)几乎完美分离,表明该变异的缺失可能是导致进一步的扩增的主要因素。

1 结果

研究人员首先使用Sanger测序分析了来自339名欧洲血统个体(146名对照和193名晚发性失调患者)的541个等位基因中FGF14重复位点的重复长度、基序含量和侧翼序列。发现在541个等位基因中大多数(343个,63.40%)重复位点的5'侧翼序列(紧邻FGF14重复位点5'和3'端的25个核苷酸)中含有一个17 bp的InDel(图1A和1B)。并且这种常见的5'-侧翼变异(5'-CFV)——17 bp的InDel只存在于<30个GAA纯重复的等位基因中,而5'-参考侧翼序列(5'-RFS)和其他5'-侧翼序列只存在于>30个重复的等位基因中(图1C)。这表明由于5'-CFV的存在,使得<30个重复的等位基因与>30个重复的长等位基因完全分离,≥250个(GAA)重复扩增的致病等位基因均不携带5'-CFV。

image004.jpg

图1-1. 常见的5'-侧翼序列变异与FGF14中<30次的GAA重复相关。

接下来,研究人员基于PacBio全基因组HiFi测序在2191个个体(4382个等位基因)中验证上面的发现,发现在3120个(71.20%)等位基因中观察到17 bp的InDel(5'-CFV)。与Sanger的数据一样,5'-CFV始终存在于重复长度较短的等位基因中,而包含5'-RFS的等位基因则相反。具体来说,3120个含有5'-CFV的等位基因中有3103个(99.46%)GAA重复数少于30个,且均为纯GAA重复,而含有5'-RFS的874个等位基因中有871个(99.66%)GAA重复数大于30个,其中652个(74.60%)为纯GAA重复(图1D)。这些数据表明,与5'-RFS相比,5'-CFV与携带少于30个GAA重复序列的等位基因密切相关。

image006.jpg

图1-2. 常见的5'-侧翼序列变异与FGF14中<30次的GAA重复相关。

接下来,研究人员通过Sanger测序(67个事件)和PacBio测序(403个事件)研究了FGF14重复位点在470个减数分裂事件中的代际传递(图2A,B)。在本分析中,所有GAA重复数少于30的等位基因都携带17 bp的InDel(5'-CFV),而更大的等位基因携带5'-RFS。研究人员观察到297个携带5′-CFV的等位基因中有283个(95.29%)稳定地从亲本传给后代(图2A,B)。另一方面,研究人员发现缺乏5'-CFV的等位基因在代际传播中表现出与其长度成正比的不稳定性(图2A,B):含有5'-RFS的30 ~ 75个三联体等位基因在99个等位基因中有50个(50.51%)稳定传播;含有5'-RFS的75 ~ 250个三联体的较大等位基因在35个非GAA纯等位基因中只稳定传播了2个(5.71%);39个重复数大于250的5'-RFS等位基因均未稳定传代(图2A,B)。

总之,这些数据表明,17-bp的InDel(5'-CFV)比5'-RFS具有更大的减数分裂稳定性,并且GAA重复长度和纯度是影响减数分裂不稳定性的主要因素。

image008.jpg

图2. 常见的5'-侧翼序列变异增强了FGF14重复位点的减数分裂稳定性。

2 讨论

综上所述,5'-CFV起到了稳定了重复位点的主要作用。由于5'-CFV的存在,短等位基因(<30个GAA重复)与长等位基因(>30个GAA重复)几乎完美分离,这表明该变异的缺失可能导致进一步的扩增,而不是由于重复位点的扩增而导致其缺失。5'-CFV可能通过一种迄今未知的分子机制帮助减数分裂的稳定性,可能与DNA复制和转录过程中不易扩张和收缩的DNA二级结构的形成有关(见补充结果和补充图6A-C)。这种变异也可能代表一种顺式元件,反式作用蛋白与之结合以调节GAA重复序列的稳定性。不管其机制如何,5'-CFV可能代表了一种进化保护基因元件,隔离了高度诱变的FGF14-SCA27B位点。因此,对FGF14侧翼变异的进一步研究和对基因组中其他类似变异的鉴定可能会进一步深入了解串联重复扩增的机制。

文献链接:https://www.biorxiv.org/content/10.1101/2023.05.11.540430v1.full

HiFi测序

HiFi测序读长能达到10-25 kb,准确度也在Q30(99.9%)以上,能提供更全面的基因组和转录组视图,在基因组的研究上具有以下显著优势:

无GC偏好,能够对基因组进行均匀且完整的覆盖;

检测包括SNP、InDel、SV、拷贝数变异、串联重复等在内的所有变异类型;

定相Phasing区分单倍型;

同时检测5mC甲基化信息。

特别是本篇研究中涉及到的串联重复序列所引起的疾病,HiFi测序无惧GC富集区域,能够跨越变异区域测得重复扩张次数,准确识别断点,也全面覆盖各种变异类型,有助于更全面地解析疾病机理。

基因有限公司

基因有限公司作为PacBio公司的中国区代理商,自2011年以来将PacBio第三代单分子实时测序技术引入国内,一直为国内用户提供专业的三代测序系统的安装培训,技术支持,应用培训与售后维护工作,赢得客户的一致好评与信任。基因有限公司将一如既往的支持越来越多的PacBio用户。

image011.gif

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号