Nanopore人重,买一送一!大小变异All in One

【字体: 时间:2019年12月27日 来源:华大科技

编辑推荐:

  基于长读长测序在检测SV中的优势,华大科技推出了Nanopore人重(送DNBSEQ 0 PCR 90G 人重)高性价比的完美人全基因组变异检测产品,使其身兼短读长、真正0 PCR和长读长的优势,可解决短读长和长读长的技术弊端,高精准检测SNP、InDel和SV。

  

长读长技术日渐成熟,并逐渐迈向个人基因组检测,其优势在于以低成本快速获取准确、全面的基因组变异信息。基于长读长测序在检测SV中的优势,华大科技推出了Nanopore人重(送DNBSEQ 0 PCR 90G 人重)高性价比的完美人全基因组变异检测产品,使其身兼短读长、真正0 PCR和长读长的优势,可解决短读长和长读长的技术弊端,高精准检测SNP、InDel和SV。

短读长无法有效检测大的结构变异(SV)

短读长测序由于读长和插入片段较短,检测SV具有偏向性,并且无法通过算法升级解决[1]。

为了更直观地看到短读长测序对SV的检测能力,我们采用了delly和manta两个软件对人标准品NA12878的SV进行评估,结果显示各短读长测序平台在SV变异的检测能力都不尽如人意,对于缺失和倒位变异检测的真阳性率(50%-60%)已经很低了,而对于重复和插入的检测更是几乎不可能。


图1 短读长测序平台SV检测真阳性率

长读长测序无法有效检测小的SNP和InDel

对于单核苷酸错误率为5%-15%的单分子长读长测序,准确鉴定DNA序列的突变尤为困难[2]。

今年3月份,《Nature communications》发表了题为《A multi-task convolutional deep neural network for variant calling in single molecule sequencing》的文章,将短读长测序检测出的SNP和InDel表现,与PacBio和ONT平台的检测结果进行比较。研究人员选取每个平台不同训练模型中表现最好的F1 score(F1 score越高表示假阳与假阴越少),发现SNP F1 score短读长比长读长测序平台高出5个百分点,而对于小的InDel,短读长测序平台的检测能力高出长读长测序平台一倍!


图2 短读长和长读长测序平台SNP和InDel变异检测能力[2]

建库测序PCR扩增影响短读长测序的变异检测

PCR过程中可能会引入碱基错配,错误频率可达0.06%[3],降低了DNA序列复制的保真性。对于核酸序列来说,由于其复杂的二级结构或热稳定性不好,会影响到PCR扩增效率,使得不同的基因组序列存在扩增偏向性,从而降低基因组覆盖度[4]。此外,PCR过程会引入错误的InDel[5],当DNA两条链上的嘌呤嘧啶含量不平衡时会增加缺失发生的几率[6],序列中PolyA结构、高GC含量的序列会增加复制滑移,从而增加了引入InDel的几率[7]。因此,PCR建库比PCR-free建库的WGS测序数据多引入3.4万个错误的InDel!


图3 PCR与PCR-free建库数据检测出错误的InDel数量

SNP、InDel和SV大小变异一网打尽

基于长读长测序自身的优势,其在寻找SV中有得天独厚的优势,为了评估DNBSEQ 0 PCR+Nanopore在人样本中检测SV的能力,我们检测在人血样本中的F-measure,结果显示DNBSEQ 0 PCR+Nanopore人重基因组检测中F-measure可高达86.81%,相比非DNBSEQ PCR提高了103%,相比单独Nanopore提高了2.3%。

华大自主平台DNBSEQ加上真正意义上的0 PCR建库,可完美检测SNP和InDel,结果显示,DNBSEQ 0 PCR+Nanopore的检测SNP的 F-measure高达99.74%,对InDel 的F-measure高达98.48%。

另外,我们评估错误变异数量,结果显示DNBSEQ 0 PCR+Nanopore错误变异数量相比Nanopore和非DNBSEQ PCR低。


图4 高F-measure检测SNP、InDel、SV


图5 DNBSEQ 0 PCR+Nanopore错误变异数量低
F-measure=2PR/(P+R)。P:精确度;R:召回率,精确度和召回率都高时, F-measure值也高

文献解读

SV的检测对于人类对相关疾病的研究至关重要,以下是相关案例。

案例1:种群SV检测及数据库建立[1]

结构变体涉及许多疾病,并构成人类基因组中不同核苷酸的大部分。由于SVs与SNV相比通常体积较大,因此与SNV或小型插入缺失相比,其功能影响更大[2]。因此很明显,对这种SV的更详细分析可以为我们提供未来疾病关联研究的重要信息。

长期以来,人们对SV的探索均是使用了短读长测序技术,该技术对于SV检测有着不缺准性,一直是无法解决的事情,特别是对于SV结构的复杂性研究。该文想构建第三版图的SV图谱,采用illumina测序技术对26个种群测序,对千人的SV进行了新的补充, 并探索出了48381个新的SV,同时采用Nanopore测序技术对PCR扩增产物测序来探索验证倒置序列的复杂性。


图6 对千人SV的补充并验证其复杂性

案例2:临床病患检测筛查诊断[3-4]

目前临床中很多疾病并未找到明确的基因变异与其关系,很大一部分是由于短读长测序的弊端所致。短读长因读长较短,对SV的检测存在更大的挑战。因此长读长测序的优势显然是在检测SV上。SV与人类疾病的关联性可能比我们目前所知的更大。

使用Nanopore测序平台对具有多种先天性异常的两名患者的基因组进行测序,两名患者都有复杂的表型,包括畸形特征和精神发育迟滞,可能是由于他们从头复杂的染色体重排,用Nanopore测序数据评估了在该覆盖率下检测这两名患者的复杂断裂点的性能,同时揭示了一些短读长数据遗漏的新变体。


图7 短读长数据遗漏的新变体

案例3:解复杂SV结构[5]

目前已经有许多疾病涉及SV,且被证实有直接联系,但是具体的SV结构并没有被解出。这影响了我们对疾病发病机理和分子机制的理解,因此解出这些复杂的SV至关重要。

良性家族性成人肌阵挛癫痫(BAFME)是一种常染色体显性遗传疾病,尽管人们对位于候选区域内的38种基因的所有外显子进行了全面的突变分析,包括拷贝数分析,但致病突变尚未确定。利用Nanopore测序平台对患有良性家族性成年人肌阵挛癫痫(BAFME)的病人测序,解出扩展重复配置的复杂SV结构。对51个家族测序,其中两个家族的重复配置出现在TNRC6A和RAPGEF2基因中,没有出现在常规SAMD12基因中,阐明了致病基因中的重复序列与疾病关系的新机理。


图8 扩展重复配置的复杂SV结构

Nanopore检测SV部分高分文章列表[1-9]

由此可见,DNBSEQ 0 PCR+Nanopore可高F-measure的检测SNP和InDel,再加上长读长Nanopore测序平台自身的优势可以获得高F-measure的SV,使得可高同时检测出SNP、InDel、SV等大小变异。有很大一部分原因是由于短读长测序存在一些弊端,因其读长短,对SV的检测存在更大的挑战,导致无法明确很多疾病与基因变异的关系。

华大科技推出了Nanopore人重【送DNBSEQ 0 PCR (90G,30X)】高性价比的完美人全基因组变异检测产品,不仅可以在检测SV的同时检测SNP、InDel,且价格低、周期短,是许多科研工作者的福音。

DNBSEQ PCR-free + Nanopore人全基因组重测序,大小变异,一个都不能少!

注:BGISEQ-500、MGISEQ-2000等华大自主测序平台都是基于DNBSEQ™技术,所以统称为DNBSEQ平台。

1. Sudmant, P. H. et al. An integrated map of structural variation in 2,504 human genomes. Nature 526, 75-81, doi:10.1038/nature15394 (2015).

2. Wong, J. H. et al. Identification of intermediate-sized deletions and inference of their impact on gene expression in a human population. Genome medicine 11, 44, doi:10.1186/s13073-019-0656-4 (2019).

3. Cretu Stancu, M. et al. Mapping and phasing of structural variation in patient genomes using nanopore sequencing. Nature communications 8, 1326, doi:10.1038/s41467-017-01343-4 (2017).

4. Euskirchen, P. et al. Same-day genomic and epigenomic diagnosis of brain tumors using real-time nanopore sequencing. Acta neuropathologica 134, 691-703, doi:10.1007/s00401-017-1743-5 (2017).

5. Ishiura, H. et al. Expansions of intronic TTTCA and TTTTA repeats in benign adult familial myoclonic epilepsy. Nature genetics 50, 581-590, doi:10.1038/s41588-018-0067-2 (2018).

6. De Coster, W. et al. Structural variants identified by Oxford Nanopore PromethION sequencing of the human genome. Genome Res 29, 1178-1187, doi:10.1101/gr.244939.118 (2019).

7. Bowden, R. et al. Sequencing of human genomes with nanopore technology. Nature communications 10, 1869, doi:10.1038/s41467-019-09637-5 (2019).

8. Sanchis-Juan, A. et al. Complex structural variants in Mendelian disorders: identification and breakpoint resolution using short- and long-read genome sequencing. Genome medicine 10, 95, doi:10.1186/s13073-018-0606-6 (2018).

9. Ebbert, M. T. W. et al. Long-read sequencing across the C9orf72 'GGGGCC' repeat expansion: implications for clinical use and genetic discovery efforts in human disease. Molecular neurodegeneration 13, 46, doi:10.1186/s13024-018-0274-4 (2018).

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热搜:华大|Nanopore|变异|

  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号