重访Eck与Dayhoff的铁氧还蛋白进化模型:基于AlphaFold2的结构证据与系统发育年代学分析

《Journal of Molecular Evolution》:Revisiting Eck and Dayhoff’s Building Block Model of Ferredoxin Evolution on Dayhoff’s 100th Birthday

【字体: 时间:2025年11月07日 来源:Journal of Molecular Evolution 1.8

编辑推荐:

  本研究为纪念Margaret Dayhoff诞辰100周年,重新审视了其与Eck于1966年提出的铁氧还蛋白串联复制进化假说。作者采用AlphaFold2从头结构预测技术,结合系统发育年代学方法,验证了铁氧还蛋白通过基因复制事件的起源机制,揭示了其结构域和环状模体的演化时序。研究不仅证实了早期进化中存在模块化构建单元,同时挑战了“简化氨基酸库驱动复制事件”的传统观点,为理解早期分子进化提供了新的结构生物学证据。

  
在分子进化研究领域,铁氧还蛋白作为古老的电子传递蛋白,一直是探索生命早期进化的重要模型。60年前,Eck和Dayhoff通过对Clostridium pasteurianum铁氧还蛋白序列的分析,发现其两端具有对称的CX2CX2CX3CX18CX2C2C3C间隔特征,由此提出铁氧还蛋白可能通过串联复制事件从含有简化氨基酸库的祖先序列演化而来。这一开创性工作不仅奠定了序列比对的基础,更启发了后续对蛋白质模块化进化的研究。然而,由于当时技术限制,该假说缺乏结构层面的直接证据。随着人工智能技术在结构预测领域的突破,特别是AlphaFold2的出现,使得从序列直接推测远古蛋白质结构成为可能,为验证这一经典假说提供了新的机遇。
本研究采用多学科交叉的研究策略,主要技术方法包括:1)基于深度学习的AlphaFold2从头结构预测流程,辅以I-TASSER线程化工具进行基准测试;2)利用结构分类数据库SCOP(Structural Classification of Proteins)和环状模体数据库ArchDB进行结构域和环状模体的系统分类;3)通过8127个参考质量蛋白质组的系统发育基因组学分析,构建结构域和环状模体的进化时间线;4)使用Chimera进行结构比对和可视化,通过TM-score(Template Modeling Score)和RMSD(Root Mean Square Deviation)评估结构相似性。
验证复制模型的从头结构预测
研究人员首先将Eck和Dayhoff提出的“回溯预测”祖先序列(对应其图1第5行)通过AlphaFold2进行结构建模,获得高置信度结构模型(pLDDT=78.5)。该模型与参考铁氧还蛋白(PDB entry 1CLF)的两个半部分均能较好对齐,特别是在[4Fe-4S]结合位点区域,TM-score值分别为0.398和0.406,为串联复制模型提供了原子水平的结构证据。然而,对更深层的祖先构建单元(富含ADGS重复序列)的结构预测则产生低置信度的无规则卷曲,无法与铁氧还蛋白结构对齐,这对“简化氨基酸库驱动复制”的假说提出了挑战。
探索串联复制的起源
通过构建结构域和环状模体的进化时间线,研究发现铁氧还蛋白的起源相对较晚。短链铁氧还蛋白家族(SCOP d.58.1.1)出现在约27亿年前,比行星大氧化事件(GOE)早约2.5亿年。环状模体分析表明,最古老的环原型DS.EG.1.1.12(nd=0.279)定位在铁氧还蛋白分子的C端半部分,其出现时间与短链铁氧还蛋白家族高度一致,支持复制事件起源于C端半部分的假说。
铁氧还蛋白超家族的进化历程
研究揭示了[4Fe-4S]铁氧还蛋白超家族的逐步进化过程:短链铁氧还蛋白(d.58.1.1)首先通过串联复制形成基本框架,随后通过簇丢失、环状模体招募和末端延伸等方式,分化出单[4Fe-4S]簇铁氧还蛋白(d.58.1.4)、7Fe铁氧还蛋白(d.58.1.2)和古菌铁氧还蛋白(d.58.1.3)。特别值得注意的是,单[4Fe-4S]簇铁氧还蛋白中关键环状模体MCL.EH.9.3.1位于N端区域,而短链铁氧还蛋白中同一模体位于C端区域,这种头尾排列方式进一步支持了祖先序列起源于C端半部分的结论。
本研究通过整合先进的结构预测技术与进化年代学分析,为Eck和Dayhoff的经典假说提供了强有力的结构证据。研究证实了铁氧还蛋白通过串联复制事件的起源机制,但挑战了“简化氨基酸库驱动复制”的传统观点。研究还揭示了铁氧还蛋白超家族通过模块化元件的招募和重组逐步演化的精细过程,为理解早期蛋白质进化中模块化构建单元的作用提供了新视角。这项工作不仅是对Dayhoff开创性贡献的恰当纪念,也展示了现代计算生物学方法在解决长期进化问题上的强大能力。研究结果强调,蛋白质结构的深层历史信息可以被有效提取,从而揭示生命分子演化的关键步骤,这对理解生命起源和早期进化具有重要意义。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号