拷贝数变异(CNV)分析的工具变迁[新品推荐]

【字体: 时间:2016年08月25日 来源:生物通

编辑推荐:

  在经典遗传学中,我们了解到人类通常携带基因的两个拷贝 – 一个来自母亲,另一个来自父亲。不过,数量也可能不是二,这就被称为拷贝数变异(CNV)。在DNA复制的过程中,基因可能丢失或重复,从而改变其数量。基因拷贝数的增加或减少往往影响其编码的蛋白质。事实上,CNV可用于生物学和医学中多个领域的研究。

在经典遗传学中,我们了解到人类通常携带基因的两个拷贝 – 一个来自母亲,另一个来自父亲。不过,数量也可能不是二,这就被称为拷贝数变异(CNV)。在DNA复制的过程中,基因可能丢失或重复,从而改变其数量。基因拷贝数的增加或减少往往影响其编码的蛋白质。事实上,CNV可用于生物学和医学中多个领域的研究。

据Pacific Biosciences的首席科学官Jonas Korlach介绍,CNV与人类进化、性状和疾病相关联。“比如,与猿猴相比,人类的AQP7基因拷贝数增加,这与出汗调节体温的能力增加存在关联,也许有利于人类祖先狩猎时长距离的奔跑。”他补充道。

拷贝数的变化也与一些疾病相关,包括自闭症、癌症和心脏病。“一些较小重复的拷贝数差异与许多神经退行性疾病相关,如肌萎缩性侧索硬化症(ALS)或Lou Gehrig疾病,”Korlach谈道。

高科技工具

过去,人们利用细胞遗传学技术研究CNV,特别是荧光原位杂交(FISH)。赛默飞世尔的营销副总裁Kim Caple表示:“FISH是视觉的,也是主观的。”尽管价格不贵,但是FISH只能鉴定数千个碱基或更大的拷贝数变异。

为了提高特异性,一些研究人员使用芯片技术,如比较基因组杂交芯片(aCGH)。芯片技术“有专门的数据分析软件,缩短了获得结果的时间,”Caple说。“除了CNV,芯片也提供单核苷酸多态性(SNP)的数据。”芯片方法可针对特定基因或整个基因组。此外,它的分辨率优于FISH。芯片的分辨率达25 kb,而FISH为40-100 kb。

在一项肾细胞癌的研究中,南卡罗莱纳医科大学的Cynthia A. Schandl及其同事利用SNP芯片来研究CNV。她表示,这项技术不仅能计算整个基因组内的拷贝数,还能确定嵌合以及杂合性丢失的区域。想象一下,一个人携带了正常和异常版本的抑癌基因。若不幸丢失了正常的那个,就无法抑制癌症生长,这就是杂合性丢失(LOH)的例子。事实上,LOH在许多癌症的发展中起作用,而CNV分析可研究这种致癌机制。

为了更深入了解染色体的结构,研究人员也采用DNA测序来分析CNV。这些测序技术“经常用于科研,也正在向临床发展,”Korlach说。“一些测序分析能够以单碱基对的精度鉴定拷贝数变异。”

测序方法带来了明显的优势。麻省理工学院的博士研究生Kristin Knouse认为,主要好处在于在全基因组范围内高分辨率地评估拷贝数变异,而不像FISH只研究几个预设定的位点。此外,在开展双端测序时,人们有望确定一些推定CNV的信息,如杂合性丢失和结构重排。当然,天下没有免费的午餐。Knouse认为测序的主要缺点在于费用。

了解PacBio最新推出的Sequel测序平台

没那么简单

尽管分析CNV的技术在不断进步,“但准确解释拷贝数变异仍然很困难,”Korlach谈道。“第一个挑战在于鉴定变异时不够精确。”也就是说,FISH、aCGH,甚至一些DNA测序技术,都不能划定拷贝数增加或减少的精确边界。“此外,这些分析不能说明基因组中是否插入了新的拷贝,”Korlach解释道。

尽管测序带来了更多深度数据的好处,但它的缺点在于“非均匀的全基因组扩增有可能带来人为的拷贝数改变,”Knouse说。“因此,关键要采用严格的质量控制标准,来限制假阳性的可能。”

此外,这些技术本身也很复杂。在被问及分析拷贝数变异的主要挑战时,Caple指出,分析需要专业知识,也相当耗时。她特别指出了将整个过程自动化以及处理意义不明的变异的挑战。

豪华工具箱

为了更多地了解CNV,科学家们需要更加精确的数据,而现代化工具也开始崭露头角。“新的DNA测序技术有望将拷贝数变异的边界和位置精确定位到单个碱基,这是最高的分辨率,”Korlach指出。然而,并非所有测序都能达到这种能力。

“短读长测序仪分析100-200 bp的DNA片段,不能清晰地分辨许多拷贝数变异,因为许多变异的长度是读长的10-100倍,”Korlach解释道。“长读长测序仪,如PacBio RS II和Sequel平台,产生了长达50 kb的序列。”简单来说,测序仪的读长越长,分析变异就越轻松。

Korlach还指出,长读长测序仪能确定基因组中究竟有多少个拷贝,以及这些拷贝位于什么位置。“即使是那些很小的三核苷酸重复,它们通常超出了短读长测序仪的范围,比如与脆性X综合征相关的FMR1基因中的CGG重复。”

未来在何方

长读长测序仪的成本下降正在扩大测序的应用,这将带来更大的数据集。“这将让人们更好地理解‘正常的’拷贝数变异,并最终全面区分致病变异和正常变异,”Korlach说。

不断增长的数据也在驱动人们以更多的方式去分析结果。例如,Caple提到了Affymetrix的ChAS 3.1,这是一个数据分析软件包,适合CNV的细胞遗传分析。她还提到,患者的数据共享将减少意义不明的变异。

最终,CNV研究界的数据共享将从这些结果中挖掘出更多的信息,这些知识有助于加强基础研究和转化研究。

(作者:Mike May / 生物通编译)

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号