《Computational Biology and Chemistry》:Tracing the molecular evolution of essential GTPase Obg CgtA reveals a direct association of its C-terminal domain with the diversity of bacterial phyla
编辑推荐:
本研究通过系统分析737种细菌CgtA蛋白的C-末端域(CTD),发现其结构变异与细菌系统发育及真核生物细胞器起源相关。早期分化的菌类保留具有OCT结构的CTD,而后期分化的革兰氏阴性菌及内共生菌CTD缺失或缩短,叶绿体同源蛋白保留OCT结构,提示CTD进化具有非随机性,为研究蛋白质进化提供了新标记。
阿南雅·查特吉(Ananya Chatterjee)| 萨特里克·巴塔查里亚(Sautrik Bhattacharya)| 阿拉文德·文卡塔苏布拉马尼安(Aravind Venkatasubramanian)| 帕尔塔·普拉蒂姆·达塔(Partha Pratim Datta)
印度西孟加拉邦纳迪亚(Nadia)莫汉普尔(Mohanpur)的印度科学教育与研究学院(Indian Institute of Science Education and Research)生物科学系,邮政编码:741246
摘要
GTP酶Obg CgtA是一种多功能的关键细菌蛋白,由保守的N端Obg结构域和GTP酶结构域以及可变的C端结构域(CgtA-CTD)组成。通过对来自737种不同细菌的CgtA序列进行大规模生物信息学分析,我们对这种重要蛋白质进行了系统发育研究。研究结果表明,CgtA的长度与其系统发育和进化之间存在正相关关系。具体而言,早期分支的细菌门类主要保留有序的CgtA-CTD结构,这种结构具有从Thermus thermophilus的晶体结构中鉴定出的独特折叠结构,称为Obg C端折叠或OCT折叠;而后期进化的细菌门类(主要为革兰氏阴性菌)则明显缺乏OCT样折叠,并且C端结构域的氨基酸长度显著减少。这种减少也出现在内共生细菌(如蓝细菌和α-变形菌)中,这与真核细胞器的起源有关。此外,叶绿体中的CgtA同源物含有OCT样折叠,而线粒体和细胞质中的CgtA同源物则没有这种折叠,这突显了它们不同的进化路径。这些观察结果共同强调了CgtA的进化意义,特别是其C端结构域在微生物适应中的作用,为细菌进化和真核细胞器的起源提供了见解。因此,这项研究揭示了CgtA-CTD的结构变异性并非随机发生,很可能与细菌的系统发育、细胞结构及进化历史有关,表明CgtA可作为探索蛋白质进化的潜在分子标志物。
引言
细菌Obg蛋白(与Spo0B相关的GTP结合蛋白)(Trach和Hoch,1989年)也被称为CgtA(CaulobacterGTP酶蛋白)(Maddock等人,1997年),是一种对许多细菌物种的生存至关重要的蛋白质,例如Bacillus subtilis(Ferrari等人,1985年)、Vibrio cholerae(Shah等人,2008年)、Vibrio harveyi(Sikora等人,2006年)、Streptomyces coelicolor(Okamoto和Ochi,1998年)、Caulobacter crescentus(Maddock等人,1997年)、Escherichia coli(Kobayashi等人,2001年)、Streptococcus pneumoniae、Streptococcus aureus和Haemophilus influenzae(Zalacain等人,2003年)。这种高度保守的蛋白质属于P环Obg GTP酶家族。在真核生物的细胞器(叶绿体和线粒体)中也发现了类似Obg的蛋白质同源物(Morimoto等人,2002年)。这种多功能蛋白质参与多种关键细胞过程,如核糖体成熟、DNA复制、染色体分离、严格反应以及孢子形成(Shah等人,2008年;Sikora等人,2006年;Datta等人,2004年;Foti等人,2007年;Raskin等人,2007年;Sikora-Borgula等人,2002年;Vidwans等人,1995年)。然而,其确切的分子作用机制尚未阐明。
该蛋白质主要在细胞水平上作为GTP的传感器(Okamoto和Ochi,1998年;Lin等人,1999年;Okamoto等人,1997年;Wout等人,2004年)。当感知到营养不足时,它会停止蛋白质合成,从而使细菌进入休眠状态,从而有助于维持其生存能力。尽管CgtA的GTP水解速率相对较低,但V. harveyi的CgtA水解速率比同家族的其他细菌高10倍(Sikora等人,2006年),而在S. typhimurium中,CgtA对GDP的亲和力比GTP高3.8倍(Lamb等人,2007年),这表明CgtA的特异性和有效性可能取决于不同的生态位。CgtA通过作为rRNA/核糖体蛋白折叠伴侣或支架蛋白参与核糖体的生物发生过程,CgtA突变细胞表现出16S rRNA处理缺陷和核糖体蛋白水平的变化(Sato等人,2005年)。通过对在最小培养基中生长的V. cholerae进行比较RNA-Seq和蛋白质组学分析,研究人员发现CgtA敲低显著改变了数百个与生存相关的基因和蛋白质的表达(Das等人,2023年)。
细菌Obg/CgtA蛋白具有三个已知的结构域:N端的Obg结构域、中间的GTP酶结构域和C端的C端结构域(CTD)。虽然前两个结构域在细菌中较为保守,但C端结构域(CTD)在不同物种间存在显著差异(Buglino等人,2002年)(图1)。B. subtilis的CTD截短突变体显示出GTP酶活性没有变化,表明该结构域非必需(Buglino等人,2002年)。在C. crescentus中,该结构域对于正常生长是必需的(Lin等人,2004年);而在E. coli中,截短该结构域没有显著影响(Kint等人,2012年)。据报道,在E. coli和Mycobacterium tuberculosis中,该结构域包含一个无序区域(Gkekas等人,2017年;Anurag和Dash,2009年)。由于该结构域高度无序,因此无法获得E. coli或B. subtilis的晶体结构(Gkekas等人,2017年;Anurag和Dash,2009年)。在Thermus thermophilus中,已经获得了CgtA的晶体结构,其中CTD具有独特的折叠结构,称为OCT折叠;然而,在CTD与其他两个保守结构域连接处存在较大间隙(Kukimoto-Niino等人,2004年)。这是迄今为止从任何细菌中获得的唯一一个CgtA-CTD结构。独特的OCT折叠由四个β折叠片和三个α螺旋组成,两侧各有一个额外的β折叠片。在T. thermophilus中,这种折叠与GTP结合结构域相互作用,特别是与相邻晶体中的G1、G3和G4区域相互作用,导致寡聚体的形成(Kukimoto-Niino等人,2004年),表明CTD在某些生物学条件下可能参与瞬态分子间相互作用(Kobayashi等人,2001年;Kukimoto-Niino等人,2004年)。关于这两个保守结构域的结构信息见补充文本T1。尽管还需要进一步研究来确定CTD的确切功能,但已有证据表明CTD可能参与GTP结合(Gkekas等人,2017年)。CgtA-CTD的可塑性在进化上具有重要意义,因为CgtA功能障碍引起的多效性效应通常具有物种特异性。根据Feng等人(2014年)的研究,这可能是由于CTD的高序列和结构可塑性,使其能够在不同物种中与不同的辅助蛋白结合,从而根据细胞的代谢和能量状态微调核糖体组装和蛋白质合成。这表明,虽然N端和GTP酶结构域保持核心重要性,但CTD作为一种专门模块,可以根据不同门类的独特生理需求调节细胞反应。
CgtA的CTD区域存在变异,这使得该结构域成为研究关键且保守蛋白质结构变异性的理想候选对象,同时不会改变蛋白质的主要功能。然而,目前尚不清楚CgtA-CTD的变异是否随机发生,或者它们是否与细菌的系统发育或细胞结构相关。在这项研究中,我们探讨了CgtA-CTD的结构进化是否遵循可预测的系统发育路径,并分析了OCT样折叠的存在与否与细菌群体间主要进化变化之间的相关性。为此,我们详细分析了属于不同分类群的细菌物种的CgtA-CTD的结构、序列和长度变化,重点关注它们的系统发育位置。基于CgtA-CTD序列建立的系统发育关系有助于了解导致该结构域氨基酸序列变异的进化线索。总之,这项工作展示了将结构生物学与大规模微生物进化研究相结合,以揭示新的功能和适应性见解的力量。
数据挖掘
我们研究了UniProtKB/Swiss-Prot数据库中细菌的Obg蛋白(即CgtA)的氨基酸序列。仅考虑了经过审核的数据,以确保数据的真实性和准确性。所有不完整、片段化、重复或未分配的序列都被移除,以避免计算错误。通过利用所有737个经过审核的序列,我们最大化了分类覆盖率和数据完整性。
CgtA的C端结构域在不同细菌物种间存在显著差异
分析了737个细菌样本的CgtA蛋白序列,以表征C端结构域(CTD)的特征。虽然N端的Obg结构域和中央的GTP酶结构域在所有细菌门类中都高度保守,但CTD表现出显著变异。使用Skylign图进行的序列水平分析证实,变异主要发生在保守的GTP酶结构域与CTD的连接处(图1A)。所有收集到的序列中,98.77%的
CgtA-CTD的意义
GTP酶Obg或CgtA是一种多功能蛋白质,是一种关键的P环GTP酶,通过构象变化控制多种细胞过程,例如在与GTP结合时“激活”,在与GDP结合时“失活”(Kint等人,2014年)。这些构象变化由下游效应蛋白感知,并相应地传递信号以影响各种细胞过程(Gilman,1987年)。为了实现GTP水解,N端Obg结构域的必要性
未引用的参考文献
(Chatterjee和Datta,2015年;Chatterjee和Datta,2017年;Das和Datta,2022年;Kuo等人,2004年;Lin和Maddock,2000年;Lin等人,2001年;Meena等人,2008年)
CRediT作者贡献声明
帕尔塔·普拉蒂姆·达塔(Partha Pratim Datta):撰写——审稿与编辑、验证、监督、资源管理、项目管理和方法论设计。阿拉文德·文卡塔苏布拉马尼安(Aravind Venkatasubramanian):撰写——初稿撰写、实验研究、正式分析。萨特里克·巴塔查里亚(Sautrik Bhattacharya):撰写——初稿撰写、数据整理。阿南雅·查特吉(Ananya Chatterjee):撰写——初稿撰写、方法论设计、实验研究、正式分析、数据整理。致谢
作者感谢印度科学教育与研究学院(IISER)生物科学系资助的Cryo-EM图像处理和计算生物学设施提供的计算生物学支持。作者还感谢IISER生物科学系的Dipjyoti Das博士在系统发育树构建方面提供的宝贵建议。AC获得了DST的博士奖学金支持;SB获得了UGC的博士奖学金支持;AV获得了IISER的博士奖学金支持。