新一代的人类互作组研究[创新技巧]

【字体: 时间:2012年08月29日 来源:生物通

编辑推荐:

  如今,Vidal及其他人已经绘制了超过20%的人类互作组。互作组学领域的科学家们已经开发出一些方法,优化酵母双杂交筛选和新一代测序。但这是一个很小的领域,他们的结果受限于高的假阴性和假阳性。因此,他们在不断开发新技术和新的计算方法,以协助他们的研究。

近日,BioTechniques的记者讲述了研究人员如何借助新一代测序技术,来加速他们的人类互作组(interactome)研究。

1993年,系统生物学家Marc Vidal开始酝酿,绘制出活细胞内每个蛋白之间的所有相互作用。那时大部分科学家正沉浸在基因测序的喜悦之中,但Vidal对蛋白更感兴趣。他想,如果所有基因都测序完成,那么下一个合理的目标将是绘制出所谓的蛋白互作组。

然而,这并非一件简单的工作。那时,酵母双杂交筛选只有四年,且实验很耗时。关于蛋白相互作用的测定,还没有高通量的方法。但随着测序的费用开始下降,Vidal开始觉得潮流变了。

如今,Vidal及其他人已经绘制了超过20%的人类互作组。互作组学领域的科学家们已经开发出一些方法,优化酵母双杂交筛选和新一代测序。但这是一个很小的领域,他们的结果受限于高的假阴性和假阳性。因此,他们在不断开发新技术和新的计算方法,以协助他们的研究。

当科学家在测序人类基因组时,他们明确知道他们在做什么。基因组是线性的,您可以准确找到起点和终点。对于互作组,就没那么简单了。人类细胞至少编码了20,000个蛋白,而每个蛋白都有可能与其他任一蛋白相互作用。这样就有2亿对蛋白要检验。

Stitch-seq技术

在经典的酵母双杂交研究中,目的蛋白(诱饵)融合在酵母转录因子GAL4的DNA结合域(DBD),它与报告基因的上游结合。GAL4的转录激活域(AD)与文库中的每个蛋白(猎物)融合,以检测它们与诱饵蛋白的可能相互作用。随后每个猎物-AD融合蛋白与诱饵-DBD融合蛋白共表达。如果猎物蛋白与诱饵蛋白结合,那么GAL4转录因子将会重建,导致报告基因的表达。利用这种方法,一个基因的所有结合伴侣都可以鉴定出。

酵母双杂交的高通量版本则加快了蛋白间相互作用的鉴定步伐,但受限于需要Sanger测序来确定互作伴侣。新一代测序(NGS)将大大加速此过程,但考虑到所有互作伴侣的PCR扩增子的合并将消除每一对之间的特异关联,这不太适用。去年,Vidal开发出一种名为Stitch-seq的方法,将NGS应用在酵母双杂交筛选中。

Stitch-seq的关键步骤在于PCR拼接(PCR stitching),这种PCR方法将每个相互作用伴侣的两个序列连接成单个PCR扩增子,之后再进行合并。Vidal表示:“这种方法的魅力在于我们拼接的方式,我们在两个片段之间引入了一段已知核苷酸。它是完全自动的。”DNA序列的拼接确保了相互作用伴侣对在新一代测序时的关联。

他们的策略使整体费用降低了近40%,并允许通量增加。随着新一代测序技术的不断改善,测序费用会持续下降。他们在研究中选择了454 GS FLX测序平台。之所以选择这个平台,是因为454技术是新一代测序中读长最长的,而82 bp的接头长度要求平均读长要超过100 bp,才能可靠鉴定相互作用序列标签。

然而,Stitch-seq的缺点在于它仍然依赖酵母双杂交。韦恩州立大学医学院的生物学家Russ Finley谈道:“我对这种技术又爱又恨。”酵母双杂交常常伴随着假阳性和假阴性。“你会得到很大的图谱,包括数千个相互作用,其中一些是好的,也有很多垃圾,还有一些漏掉了。”

因此,Finley和他的同事转向新的计算方法来分类双杂交数据,同时他们也在等待加速数据采集过程的技术。现在的问题在于,还没有技术来验证酵母双杂交的数据,甚至充分了解漏掉了什么。

但科学家们能依赖他们了解的:蛋白表达和功能的数据。如果两个蛋白从未或很少在同一组织或同时表达,那么很可能不会发生相互作用。类似地,如果已知两个蛋白的功能迥异,那么它们也不大会相互作用。诸如此类的数据可用于评估酵母双杂交数据中相互作用的可能性。此外,Finley的小组提出一种方法,综合不同的数据集,以此为基础为相互作用数据指定一个置信值。如果不同实验室利用不同方法都证明了相互作用,那么其置信值更高。

互作组生物学

一旦人类互作组绘制出,下一个问题是它将有什么用。与人类基因组相似,一旦图谱完成,以及出现新技术来采集和分析数据,数据的力量才有可能变得更清晰。不过,科学家已经显示了互作组数据在研究细胞生物学和疾病状态上的作用。

去年,马普研究院分子遗传学研究所的Ulrich Stelzl及其同事发表了超过500万对蛋白的分析,并预测了94,000多个新的相互作用。为了第一时间发现蛋白对,他们并没有依赖培养皿中的酵母双杂交,而是利用机器人控制矩阵。它加速了过程,使其自动化。

为了证明有效性,他的研究小组从阿尔茨海默病、亨廷顿氏病、肌萎缩侧索硬化症和帕金森氏症的全基因组关联研究中借来了一些数据,并与新的互作组数据相比对。他们利用网络数据来发现关联多个疾病基因的蛋白和通路。研究小组继续引入激酶,以便研究磷酸化的变化如何改变网络。

与人类基因组相似,第一步是得到一张健康的互作组图谱。然而,这条路还很漫长。Stelzl认为,此刻他们还无法完成整个互作组,然而,随着新技术的出现,这将会改变。(生物通 薄荷)

参考文献

1. Yu, H., L. Tardivo, S. Tam, E. Weiner, F. Gebreab, C. Fan, et. al. 2011. Next-generation sequencing to generate interactome datasets. Nat Methods 8: 478-480.
2. Elefsonioti, A., Ö.S. Saraç, A. Hegele, et. al. 2011. Large-scale de novo prediction of physical protein-protein association. Mol Cell Proteomics. 10: 10.1074/mcp.M111.010629, 1-13

原文检索

Next-Generation Protein Networks

订阅生物通快讯

订阅快讯:

最新文章

限时促销

会展信息

关注订阅号/掌握最新资讯

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号