长读长测序的“灾难性错误”,何以准确地检测基因组结构变异?

【字体: 时间:2019年12月18日 来源:基因快讯

编辑推荐:

  在今年11月bioRxiv杂志上发表的文章则指出:使用Nanopore对具有反向重复结构的CNV序列进行DNA测序时,出现了非常严重的错误,甚至于评价这样的错误会造成灾难性的后果。

  

长读长测序技术以其读长的优势,能够更大程度的检测结构变异(Structural Variations,SV)。然而面对市面上常见的Nanopore测序技术,检测结构变异的事实真的如此吗?在今年11月bioRxiv杂志上发表的文章则指出:使用Nanopore对具有反向重复结构的CNV序列进行DNA测序时,出现了非常严重的错误,甚至于评价这样的错误会造成灾难性的后果。

该文章的通讯作者是来自纽约大学生物学系基因组和系统生物学中心的David Gresham教授。

反向重复是拷贝数变异(CNV)的一种表现形式,其典型特征是具有两个方向相反的重复区域通过连接点进行连接。反向重复序列常见于许多基因组中。通常认为这一形式的变异在物种基因组的适应性与进化中发挥了重要的作用,并且与人类的一些疾病发生有关。

长读长测序技术以其读长优势,通常被认为在读取CNV区域有着更好的表现。本文的作者也采用了Oxford Nanopore Technology的MinION对酵母(Saccharomyces cerevisiae)进行测序,发现大多数跨越预测的反向重复连接的reads(80-100%)显示出phred低分,并且这些reads与参考基因组高度不匹配。结合来自illumina测序结果,通过分析,作者发现来自Nanopore测序低质量的数据对应的序列位于NGS数据所示反向重复连接点的附近。。

作者选择了不同的base caller软件,但都无法准确的读取这一区域的碱基序列。或许对Nanopore技术有一定认识的研究人员明白,事实上Nanopore的碱基读取依赖于机器学习对应数据与实际信号的相似度。

通过进一步的分析,作者认为反向重复序列可能形成的DNA二级结构导致了测序数据的不准确性。当反向重复结构的DNA双链解开,穿过Nanopore的纳米小孔后,容易形成单链的互补配对。由此,互补的二级机构将对后续检测的DNA分子形成拉力,从而使得碱基读取出现了不可弥补的系统性错误。而这样的错误也是灾难性的!

在长读长测序技术大放异彩的今天,结构变异的检测也逐渐受到了更多的重视。越来越多的研究采用了长读长测序技术进行结构变异相关的研究。但测序的准确性依然不可忽视,并非仅仅依靠长读长,就能够对结构变异进行精准的检测。从今天分享给各位的文章中,我们也可以发现,来自Nanopore测序技术的reads所具有系统性错误,并不利于全面的发现基因组中的结构变异,亦或是进行更准确的分析。相比之下,PacBio SMRT测序,则不仅能够获得长度更长,更为准确的DNA序列信息,用于分析包括结构变异在内的所有变异。还能借助于高达Q30的准确度,进行单倍型、顺式/反式突变的准确分析。


原文信息:
Spealman, Pieter, Jaden Burrell, and David Gresham. "Nanopore sequencing undergoes catastrophic sequence failure at inverted duplicated DNA sequences." BioRxiv (2019): 852665.



相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号