测序灰色地带的灯塔

--BioNano单分子基因图谱

【字体: 时间:2015年12月15日 来源:

编辑推荐:

  单分子基因图谱在提供基因组信息的完整性及真实性上是现阶段任何测序手段所不可替代的,同时又是必须的。它的出现无疑会给测序领域带来一道曙光,它是一座灯塔照亮测序无法触及的灰色角落,让基因组研究走的更远走的更稳。

“旧时王谢堂前燕,飞入寻常百姓家”

新一代测序NGS技术(Next Generation Sequencing)是一道分水岭,它将农业、医学等多个领域的研究真正地带入了基因组时代。

它的低成本、高通量使测序这个原本遥不可及的实验,变得轻松容易。对于大多数研究者来说,当对所研究的物种进行测序,在技术及成本等方面成为可能时,都会**时间选择获取序列信息,然后展开相应领域里的研究。

这对于追求发表数据的时效性抑或共享数据的及时性来说无可厚非,此时测序技术给人们带来的欣喜是数据的从无到有,从少到多。由于大多数物种的基因组数据都可称得上相应领域的盘古开天,研究者们对NGS技术趋之若鹜也便不足为奇了。

而当洪水般的测序数据涌现,很快填补了各领域对测序数据需求的渴望之后,大量冗余的数据卡在技术瓶颈,这就需要去伪存真,去芜存菁,科学家们开始驻足冷静地思考数据的质量,以及对后续研究的指导性。
 
“欲穷千里目,更上一层楼”

另一方面,基因有限公司代理的第三代测序PacBio公司SMRT技术(单分子实时测序)也极大的促进了基因组测序技术的进步。第三代测序技术的诞生也恰恰满足了科学家们对NGS狂热过后的理性需求。

有实验证明利用NGS进行人类全基因组测序和组装所获得的数据与参考基因组相比缺失了近16%的序列信息(其中重复序列占有极大的比例)。可见我们的步伐应该慢下来,对测序数据的追求也应转向质量而非一味地追求数量。

单独使用一种技术来进行测序,可能会落入方法学所导致的偏差中,而应该采用多平台综合性技术手段,才可多方面更平衡地进行数据质量评估。SMRT三代测序技术以长读长的技术优势出现,极大地弥补二代由于读长短所引起种种问题,其中包括重复序列的组装,结构变异的识别等,使二代的技术瓶颈有被突破的可能性。


 
图解:在测序这个拼图游戏中,手中的拼图越大,就越容易获胜,而这个胜利绝不仅仅是节约时间成本,更关键的是数据准确性。

“不识庐山真面目,只缘身在此山中”

在对测序数据组装的过程中,造成拼接困难的主要是由于各种重复序列的存在。而用小于重复单位的读长片段来组装出完整的重复区域,更显得力不从心,甚至是不可完成的任务。而如着丝裂、端粒等异染色体部位的组装以及被长gap所隔断的序列信息拼接*为复杂,可称作是测序的“灰色地带”。

无论NGS还是PacBio的三代,都面临着重复区域所带来的问题,只是阻碍他们的重复区域或gap区域相对的长短不同,影响的程度轻重而已。PacBio三代测序对于二代来说*为关键也*为 “致命”的技术优势就是,三代拥有更为完整(因为长度长)和真实的(因为单分子)序列信息。


 
我们把原本完好的基因组“撕扯”得支离破碎,然后对成千上万个片段进行管中窥豹,*后再将零碎的片段信息拼凑出基因组原始的模样。现阶段测序技术超越不了这种实验方法,就无法彻底摆脱单纯利用测序数据进行拼接组装所带来的一些与真实情况的偏差。

换言之,当前的测序技术面临的束缚就在于“视野的局限性”。需要一种技术,提供宏观的框架支持,来保证拼接组装结果的准确性和真实性。


 
测序数据拼接组装的依据,或者说完美组装的极致就是还原真实染色体。那么如果有一种技术可以提供真实完整的染⾊色体框架信息的话,我们就可以轻易的依照这个框架使手中零碎的碱基信息真实完整地回归到染色体的位置上,从而完成基因测序信息的组装。 因为,退一步看的才更远。


 
“千呼万唤始出来,犹抱琵琶半遮面”

基因有限公司作为其代理的美国Bionano公司,推出的Irys系统提供的单分子光学图谱,就提供了组装参考的染色体真实“蓝图”。为了更直观的体会光学图谱在数据组装中的作用,在详细介绍之前我先举个“栗子”:


 
左图是一张答题卡,需要涂写出正确答案;恰巧我一道题也不会,只能在家靠父母,出外靠朋友了,右图是偷偷收到的写着部分正确答案的小纸条,但由于都是“局部”的答案又没有标明前后题号,所以没办法拼出一张“令我满意的答卷”。那么此时我所面临的尴尬与测序数据组装所面临的是一样的。(答题卡=DNA,小纸条=片段化的测序数据),我们现在需要做的就是“Mapping”。


 
于是我向上帝祈祷,我的要求并不高,把所有答案为D题目显示出来就好。结果就出现了上面这个神奇的画面,只有选项D被标记的分布图。然后我机智地同样把纸条上的D也都独标记出来(右图)。

这样一来,余下的工作就轻松了许多,只需按照选项D的分布⼀一致性就可将答案归位到它的真正位置上来(如上图)。“Mapping”成功了!
 
下面就来进入正题,详细介绍这款由基因有限公司代理的,可以给出“上帝提示”的Bionano单分子光学图谱系统。

实验策略: 
其整体的思路就如刚刚举的“栗子”,利用酶切标记技术实现在染色体DNA上进行特异性的标记,从而被标记的位点在空间分布上形成来物种特异性的“分子密码”,再依据酶所识别的特异性序列来对测序数据进行数字化标记,从而将测序的数据锚定到DNA分子中所在的位置。
 
Nick-Label-Repair Stain (NLRS) 标记

利用切口酶对DNA双链分子中的单链特异性序列进行识别酶切并标记荧光,在基因组范围内就生成多个特异性的酶切标记位点,再将每个DNA单分子线性化展开(微流控纳米通道技术,见下文)进行超长单分子高分辨率荧光成像,即生成了一幅酶切位点分布图。


 
Bionano利用光蚀刻技术在芯片上生成结构细微巧妙的梯度微流控管路(如下图),其中含有数万个纳米通道,供单分子DNA通过。这种直径由大到小的梯度纳米通道设计可以使DNA分子从提取时原始的团状逐渐松散变成单分子线性DNA的过程。


 
单分子高分辨率荧光成像


 
光学图谱比对及测序数据组装的应用

Bionano的光学图谱对于全基因组De novo 测序组装,及大片段基因结构变异分析研究有着无与伦比的技术优势。


 
Irys光学图谱系统特点:
•  无PCR过程:展现真实未经任何加工的原始信息;
•  无片段化操作:保持样本*完整的信息;
•  单分子检测:无任何杂信号干扰,反映*真实的DNA信息
•  超长距离检测:可达Mb级别的数据长度;
• 兼容各种测序平台

应用方向

动植物基因组研究:
在测序技术日益成熟的今天,动植物基因组研究,尤其对于暂无参考基因组序列的物种测序数据拼接与组装无疑是其研究难点,研究报道的时效性是文章质量的关键之一,现有的二代测序技术依然无法跨越片段化处理的手段来对基因组信息进行原始的检测,而BioNano技术在测序数据拼接上恰恰可以提供很高的效率和准确性,极大的补充了现有测序技术的缺陷,加快科研进展,提高数据质量。

医学基因组研究:
大片段基因的结构变异SV与疾病的相关性越来越受到医学研究者的关注,更多的研究者将视线落在了以往在研究中易被忽视却十分重要的基因组结构变异上,而不再千篇一律的做SNP分析,无论怎样的分析,其主要技术基础与保证始终是测序手段及其对基因组完整真实的还原拼接,而由于原理技术的差异,BioNano在拼接组装上的优势是任何测序技术所无法企及,同时对于测序数据拼接组装的辅助功能又是完美的,所以在与大片段结构变异密切相关的医学领域,BioNano可以有极大地潜在需求空间。

单分子基因图谱在提供基因组信息的完整性及真实性上是现阶段任何测序手段所不可替代的,同时又是必须的。它的出现无疑会给测序领域带来一道曙光,它是一座灯塔照亮测序无法触及的灰色角落,让基因组研究走的更远走的更稳。

 

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号