文献速递 | 一项国家试点研究成功证明了HiFi Revio lrGS作为染色体重排临床分析的实用性

【字体: 时间:2024年01月24日 来源:基因有限公司

编辑推荐:

  一项国家试点研究基于PacBio Revio系统建立了全国性的变异管道和共享变异数据库,涵盖了一系列简单和复杂的SVs,包括倒位、易位和拷贝数变异,成功地证明了HiFi Revio lrGS作为染色体重排临床分析的实用性。

背景介绍

临床遗传实验室通常需要对染色体重排/结构变异(SVs)进行全面分析,其范围从染色体易位和倒位等重大事件到多余的环/标记染色体,以及小的缺失或重复。为了充分了解特定事件的复杂性及其相关的临床后果,必须定位断点连接(breakpoint junctions,BPJs)并解析衍生染色体结构。然而,这项任务往往超出了传统短读长测序技术的能力。相比之下,新兴的长读长全基因组测序技术(long-read whole genome sequencing,lrGS)为临床诊断上各种类型变异的鉴定提供了一种全面的方法。特别是随着使用高准度HiFi测序技术的lrGS的引入,SNV和短InDels调用的质量得到了显著提高,并且能够在单个测序实验中表征从SNV到SVs的全谱遗传变异以及甲基化信息,为研究人类基因组中不易被其他基因组技术捕获的区域(如高重复或同源区域)提供了独特的可能性。

随着成本的降低,在尚未解决的罕见疾病病例中使用基于HiFi测序的lrGS越来越有吸引力。因此瑞典罕见病基因组医学(Genomic Medicine Sweden Rare Diseases,GMS-RD)联盟开始了一项使用PacBio Revio系统的全国性试点研究,旨在整个区域组织的医疗保健系统中实施精准医学,验证lrGS在全国范围内未解决的SV临床数字核型分析中的应用。纳入的13个样本来自瑞典七个设有大学医院区域中的五个,仅少量DNA样本使用lrGS优化方案进行高分子制备,大多是标准提取方案获得的。因此更能反映今天瑞典大多数医院和生物库中的典型样品质量和制备情况,从而使研究人员对lrGS在临床诊断中的潜力和挑战有了现实的认识。

文献速递

目前这项国家试点研究“A national pilot study: Clinical long-read sequencing of chromosomal rearrangements”发表在预印本MedRxiv,基于PacBio Revio系统建立了全国性的变异管道和共享变异数据库,涵盖了一系列简单和复杂的SVs,包括倒位、易位和拷贝数变异,成功地证明了HiFi Revio lrGS作为染色体重排临床分析的实用性。

image002.jpg

结果

本研究采用PacBio Revio测序平台对来自瑞典五个大学医院中13个样本进行了基因组测序。包括8个先证者单例、1个双例(先证者及其母亲)和 1个三例(先证者及其父母)。

1 从临床DNA样本中获得高质量的长读长基因组数据

所有个体均在Revio 25M SMRTcell上测序,对所有样本产生至少20×覆盖率的高质量HiFi reads(范围19.9 -32.1×),平均reads长度在8.3-17.6 kb之间(图1)。进一步对所有个体进行从头组装,N50值如图1C所示。在大多数情况下,从头组装的每个个体均由有限数量的contigs (N50范围为6-73 Mb)清楚地将两个等位基因分开,从而可以直接表征染色体重排。

表1. 纳入病例的核型和确定方式。

image004.jpg

image006.jpg

image009.jpg

图1. lrGS的质量评估。reads长度分布(左),测序深度(右上)和从头组装的N50(右下)。

2 染色体基因组重排鉴定

lrGS分析可以识别已知存在于特定样本中的染色体基因组重排。P10个体除外,其基因组中的镶嵌重排阻碍了SV的检测(表1)。以P2个体为例,其15号染色体上的镶嵌三体和四体的特征是长读长CNV调用中的拷贝数增加(在2和5之间)。虽然起始点无法与着丝粒区分,但终点的位置大致在chr15:32176000-32346000之间,确切的断点位于片段复制中。然后根据是否存在简单事件或复杂的重排,对剩余的样本进行细分。已确定BPJ的HGVS核型见表2。

表2. 已确定BPJ的病例的HGVS结果细分为简单重排和复杂重排。

image011.jpg

用人类基因组突变学会(Human Genome Variation Society,HGVS)标准对已建立系统的基因突变进行命名的方法,是目前学术界所公认的命名规则。

2.1易位和倒位:在4个个体中有3个易位和1个倒位(图2;表2),母亲和女儿都携带相同的两个平衡事件(P7.1和P7.3)。在P9个体中,所有的变异都被完全检测到了,但染色体X和9之间的易位t(X;9)只能使用端粒到端粒(T2T)组装进行分析。对hg38的二次分析显示,在该样本中调用了t(X;5),表明hg38中缺少断点9区域。在P1个体中,在lrGS之前检测到的三个结构变异(两个缺失和一个重复)实际上是两个独立的重排,4号染色体和9号染色体之间有1个16p缺失和1个不平衡易位(图2)。

image013.jpg

图2. lrGS识别的易位和倒位。

2.2复杂重排:如表2所示,lrGS在5个不相关的个体中发现并解决了6个不平衡的复杂重排。值得注意的是,在P8.1和P8.2这一对母女中详细描述了相同的inv(X);P4个体复杂性最高,其确定了两个复杂事件,一个DUP-TRIP-QUAD-TRIP-DUP-DEL和一个DEL-INV-DEL(图3A;表2)。复杂性紧随其后的是P5,它携带一个复杂的重排,包括两个重复,一个缺失,以及一个中性片段的拷贝数增加且呈复杂倒置(图3B;表2)。相反,最简单的重排是DEL-INV-DEL (P3和P4)或DEL-INS-DEL(P6)。

image015.jpg

图3. 两个复杂重排的图示。A. 在P4中观察到的2号染色体上的复杂dup-trip-quad-trip-dup-del。
B. 在P5中检测到3号染色体上的簇状CNV。已删除的序列以红色标注,箭头标记反转的序列。

3 断点连接点(BPJs)分析

在11个重排中,以核苷酸分辨率对BPJs进行了表征:对插入、重复元件、微同源性和断裂基因进行详细分析(表3)。研究人员将Sniffles SV调用与从头组装的调用结果进行比较,发现从头组装检测到31个BPJs,Sniffles只检测到其中的30个BPJs(表2,表3)。值得注意的是,研究人员在分析的病例中发现了这种遗传特征丰富的多样性。在两次重排中,断点包含匹配的重复元素:t(4;9)中的L1(P1)和inv(X)中的各种Alu元素(P8.1和P8.2)。在P4个体中,在6个BPJ中有5个观察到1-11个核苷酸(nt)的微同源性,并且最终的BPJ包含9 nt插入(表3)。在另外三个重排中检测到大于2 nt的插入,一个复杂的易位插入(P6)一个t(1;10) (P7.1和P7.3)和一个t(X;9) (P9)(表3,图2)。然而,对于P9个体还需要进行T2T分析,因为研究人员怀疑其990 nt插入是由于参考错误引起的。最后两个重排,chr22上的DEL-INV-DEL (P3)和chr3上的复杂DEL-INVNML-DUP-NML-DUP (P5),显示平端既没有微同源性,也没有匹配的重复序列及更大的插入(图3B,表3)。

表 3. 鉴定重排的连接特征,仅有1例只在T2T中检测到

image017.jpg

image020.jpg

image022.jpg

4 背景结构变异的表征

接下来,研究人员评估了GMS-RD lrGS队列中所有13个样本的SV。平均每个个体检测到23,814个SVs,这些SVs被细分为复合体(0.05%)、缺失(41%)、重复(1%)、插入(51%)、倒位(1%)和易位(5%)(图4A)。总的来说,检测到的SV较小,在1,000 bp以下的SV占82%,并且Alu插入/缺失的存在导致SV大小分布在大约330 bp处出现峰值(图4B)。大多数变异不止存在于一个个体中,只有30%是不同个体特有的(图4C)。最后,当与SweGen SV数据库(该数据库包含从srGS数据评估的1,000名瑞典人的背景)进行比较时,大约70%的lrGS SV是新的,并且不存在于SweGen数据集中(图4D)。

image024.jpg

图4. 背景SV的表征。A.每种类型的 SV 数量(黄色常见,绿色罕见)。B.每种SV类型的SV长度(不包括 SV
> 5 kb)。C.等位基因频率。D.GMS-lr队列和 SweGen srGS SV数据库之间的等位基因频率比较。

结论

在这个独特的国家合作项目中,研究人员已经验证了HiFi Revio lrGS作为染色体重排临床分析的实用性。

虽然srGS作为一线诊断测试显示出巨大的希望,但对于疑似罕见遗传疾病的患者,它的诊断率有限,约为40%。这一缺点是由于几个因素造成的。首先,研究人员对人类良性和致病基因组变化的了解仍然有限。在srGS数据中发现的许多变异不被认为是致病的,要么被过滤掉,要么被认为是未知的变异。其次,某些类型的变异很难用短读长来捕获,如SVs、重复扩增、以及复杂和重复基因组区域的变异。然而,lrGS正在开始克服这些限制,SV代表了lrGS在临床诊断中有希望的初始靶点。在染色体重排的背景下,通过从头组装将长读长组装为contigs增加了描述存在难以测序区域的复杂衍生染色体中的断点的可能性。这里包括的一个病例,P9,具有反向易位t(X;9),在GRCh38中未解决,但可以在T2T组装中定位,因为9号染色体BPJ位于GRCh38中缺失的序列中。

因此,综合染色体重排、背景SV和BPJ的检测结果来看,研究人员建议“在未来的研究中,强烈建议在先证者+父母或大家庭的背景下分析SV,这样可以从父母那里产生高质量的个体从头组装的基因组。这样的从头组装将提供更准确的SV形成和重复区域的基因组动力学分析”。

文献链接:https://www.medrxiv.org/content/10.1101/2023.12.15.23299892v1.full##

PacBio HiFi测序系统

HiFi测序读长能达到10-25 kb,准确度也在Q30(99.9%)以上,能提供更全面的基因组视图,主要具有以下显著优势:

 无GC偏好,能够对基因组进行均匀且完整的覆盖

 检测包括SNP、InDel、SV、拷贝数变异、串联重复等在内的所有变异类型

 定相Phasing区分单倍型

 同时检测5mC甲基化信息

基于以上优势,HiFi测序已被用来进行各种疾病的遗传因素诊断、药物基因组学研究和泛基因组组装等,使科学家能够全方位研究人类遗传变异,进行更精准地诊断和用药。并且最新高通量型号Revio测序仪的推出,则是大大提高通量,一次运行可以完成4个人30×全基因组的测序(获得360 Gb HiFi数据),进一步加快精准医学研究。

关于基因

基因有限公司成立于1992年,是一家提供生命科学科研仪器、试剂耗材和技术服务的综合服务商。基于“Gene Brightens Every Life • BioTech Connects the World”——“基因燃亮生命 • 生物技术连接世界”的愿景,专注于生命科学领域前沿技术的引进和推广,致力于推动该领域国内科研机构硬件水平及实验方案的革新与升级。同时,公司也一直致力于自主品牌的科研设备的研发与生产,拥有一系列通用性强、互补性高的自主品牌产品。

基因的服务网络遍及全国各地十多个大中城市,拥有包括仪器销售,试剂销售,市场与技术支持,维修,客服,物流等多个部门组成的完整服务体系。

我们希望通过不懈努力,为您的成功铺路搭桥,也为中国的生命科学事业赶超世界先进水平尽一己之力。欲了解更多信息,请访问www.genecompany.cn。

image028.jpg

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号