
-
生物通官微
陪你抓住生命科技
跳动的脉搏
NIBS年轻女学者连发多篇文章 解析蛋白研究
【字体: 大 中 小 】 时间:2010年11月19日 来源:生物通
编辑推荐:
无论是分析蛋白质本身的结构或功能,还是需要了解蛋白质组学的整个系统,都离不开相应的分析软件,来自北京生命科学研究所的董梦秋研究员实验室就在蛋白质,肽段等的生物信息学研究方面获得了重要的成果。董梦秋研究员早年毕业于四川大学,2001年进入耶鲁大学攻读博士学位,曾在美国斯克利普斯研究院等处进行博士后研究工作。
生物通报道:无论是分析蛋白质本身的结构或功能,还是需要了解蛋白质组学的整个系统,都离不开相应的分析软件,来自北京生命科学研究所的董梦秋研究员实验室就在蛋白质,肽段等的生物信息学研究方面获得了重要的成果。董梦秋研究员早年毕业于四川大学,2001年进入耶鲁大学攻读博士学位,曾在美国斯克利普斯研究院等处进行博士后研究工作。
近年来,电子转移裂解(Electron Transfer Dissociation, ETD )作为一种新的肽段碎裂方式,在蛋白质组学领域中获得了广泛的应用。但是现有的分析软件不能充分解析ETD质谱数据,亟待完善。
董梦秋研究组以四十多万张ETD谱图为基础,进行了大规模的统计分析,系统地总结了ETD的碎裂规律与特征,并将ETD谱图的特征应用到数据库搜索引擎pFind中,极大地提高了ETD谱图的鉴定率。这一研究成果公布在《Journal of Proteome Research》杂志上。
近年来,电子转移裂解(Electron Transfer Dissociation, ETD )作为一种新的肽段碎裂方式,在蛋白质组学领域中获得了广泛的应用。但是现有的分析软件不能充分解析ETD质谱数据,亟待完善。
研究人员以四十多万张ETD谱图为基础,进行了大规模的统计分析,系统地总结了ETD的碎裂规律与特征,其中一些是首次发表。例如,ETD碎片离子的氢重排(即失去或捕获一个甚至多个氢原子)主要受三种因素的影响:碎片离子类型(c- 或 z- 离子)、碎片离子相对于母离子的大小、以及母离子电荷状态,这远比以前所认识到的复杂。本文将ETD谱图的特征应用到数据库搜索引擎pFind中,极大地提高了ETD谱图的鉴定率。在假阳性率为1%的情况下,pFind 从+2价母离子的ETD谱图中鉴定到的非冗余肽段数比Mascot 2.2多63-122%。对于更高价态的肽段和磷酸化肽段,pFind也有更好的鉴定结果。
这一研究组还以“pNovo: De novo Peptide Sequencing and Identification Using HCD Spectra”为题,首次开发出从串联质谱图中鉴定肽段序列的算法。
以前的“从头测序”方法只能鉴定30%左右的高、中质量碰撞诱导解离(CID)串联质谱图,其效率远远低于数据库搜索。因此“从头测序”方法没有被用于解决生物学研究中的实际问题。
这项研究指出,相比于CID,高能碰撞诱导解离(HCD)更适合于“从头测序”分析。因为HCD能够提供具有高质量准确度的串联质谱图以及更加完整的离子序列。除此之外,HCD谱图中的内部碎片离子以及亚胺离子能够帮助软件区分高度相似的肽段序列。基于HCD谱图的上述特点,本文作者开发了全新的从头测序的算法pNovo,并用不同复杂程度的样品来检验它的有效性。pNovo成功解析了80%或更多的有明确肽段序列答案的HCD谱图,无论它们来自于简单的蛋白质混合物还是线虫裂解液样品。pNovo鉴定到的完整肽段序列数,与数据库搜索方法鉴定到的数目相当。“从头测序”方法的一个显著优点是,它能够有效鉴定脱去酰胺基或者存在氨基酸突变的肽段,而又不带来额外的计算负担。总之,充分利用HCD谱图的特征使得pNovo成为一个高效的“从头测序”的工具。
(生物通:万纹)
原文摘要:
Improved Peptide Identification for Proteomic Analysis Based on Comprehensive Characterization of Electron Transfer Dissociation Spectra.
In recent years, electron transfer dissociation (ETD) has enjoyed widespread applications from sequencing of peptides with or without post-translational modifications to top-down analysis of intact proteins. However, peptide identification rates from ETD spectra compare poorly with those from collision induced dissociation (CID) spectra, especially for doubly charged precursors. This is in part due to an insufficient understanding of the characteristics of ETD and consequently a failure of database search engines to make use of the rich information contained in the ETD spectra. In this study, we statistically characterized ETD fragmentation patterns from a collection of 461�440 spectra and subsequently implemented our findings into pFind, a database search engine developed earlier for CID data. From ETD spectra of doubly charged precursors, pFind 2.1 identified 63-122% more unique peptides than Mascot 2.2 under the same 1% false discovery rate. For higher charged peptides as well as phosphopeptides, pFind 2.1 also consistently obtained more identifications. Of the features built into pFind 2.1, the following two greatly enhanced its performance: (1) refined automatic detection and removal of high-intensity peaks belonging to the precursor, charge-reduced precursor, or related neutral loss species, whose presence often set spectral matching askew; (2) a thorough consideration of hydrogen-rearranged fragment ions such as z + H and c - H for peptide precursors of different charge states. Our study has revealed that different charge states of precursors result in different hydrogen rearrangement patterns. For a fragment ion, its propensity of gaining or losing a hydrogen depends on (1) the ion type (c or z) and (2) the size of the fragment relative to the precursor, and both dependencies are affected by (3) the charge state of the precursor. In addition, we discovered ETD characteristics that are unique for certain types of amino acids (AAs), such as a prominent neutral loss of SCH(2)CONH(2) (90.0014 Da) from z ions with a carbamidomethylated cysteine at the N-terminus and a neutral loss of histidine side chain C(4)N(2)H(5) (81.0453 Da) from precursor ions containing histidine. The comprehensive list of ETD characteristics summarized in this paper should be valuable for automated database search, de novo peptide sequencing, and manual spectral validation.
作者简介:
董梦秋 博士
北京生命科学研究所研究员
教育经历:
1992
四川大学生物系, 学士
1995
中国科学院上海生物化学研究所, 硕士
2001
耶鲁大学分子生物物理学与生物化学系, 博士
工作经历:
2007-present
北京生命科学研究所研究员
2003-2007
美国斯克利普斯研究院, 博士后
2001-2003
美国加洲大学圣地亚哥分校医学院, 博士后
研究概述:
本实验室的研究以蛋白质组学和衰老研究为中心。
运用目前最先进的质谱仪和多维蛋白质鉴定技术(MudPIT),我们可以大规模地鉴定蛋白质,蛋白质复合物,和蛋白质翻译后修饰。本实验室蛋白质组学研究的另一个重点是利用稳定同位素标记(15N, 13C )对极为复杂的蛋白质混合物进行定量分析。
我们以线虫为模式研究胰岛素或类胰岛素生长因子信号传导,营养限制,和一个叫 SIR-2 的去乙酰化酶调节衰老的机制。我们着重研究以下几个问题:1)确定上述几种调节衰老的途径是否共用一组靶蛋白。2)胰岛素或类胰岛素生长因子信号传导通路中有一个起关键作用的 FoxO 转录因子。我们想了解它的翻译后修饰如何影响转录活性和特异性。3)生物体是否通过 FoxO 转录因子的翻译后修饰来整合对不同水平和不同种类的应激信号的反应并进而调节衰老速度? 4) SIR-2通过什么蛋白质与胰岛素或类胰岛素生长因子以及营养限制介道的信号传导相作用?5)哪些蛋白是SIR-2的底物?我们运用质谱学,生物信息学,分子生物学,遗传学和生物化学手段研究上述课题。