基于隐马尔可夫模型的原核生物基因组空间挖掘揭示复杂体I的广泛存在及其进化机制

【字体: 时间:2025年08月07日 来源:Genome Biology and Evolution 2.8

编辑推荐:

  研究人员针对呼吸链复合体I(Complex I)进化起源不明确的问题,通过构建亚基特异性隐马尔可夫模型(HMM),系统分析了约1.1万种原核生物的基因组分布特征。研究发现51.2%物种具有完整14亚基的NADH-醌氧化还原酶(Nuo),首次揭示了质粒携带的Complex I变异体及其在进化传播中的作用,为理解生物能量代谢的分子进化提供了新视角。

  

呼吸系统是生命活动的能量枢纽,而NADH-醌氧化还原酶(Complex I或Nuo)作为其中最大且最复杂的膜蛋白复合体,堪称自然界的"分子发电机"。这个由14个核心亚基组成的精密机器,不仅负责将NADH的电子传递给醌类物质,还能驱动质子跨膜运输,在能量转换、氧化还原平衡和代谢物转运中扮演关键角色。然而,这个"分子发电机"的进化拼图始终缺失重要板块——由于亚基间复杂的同源关系,科学家们难以追溯其完整的进化路径,更无法解释为何某些微生物能在极端环境下依赖不完整的Complex I存活。

来自塔塔基础研究所(Tata Institute of Fundamental Research)的研究团队在《Genome Biology and Evolution》发表的研究,如同为这个进化谜题安装了一台"分子显微镜"。他们开发了一套基于隐马尔可夫模型(HMM)的智能探测系统,对47,278个原核生物基因组进行地毯式扫描,首次绘制出Complex I亚基在生命世界的完整分布图谱。这项研究不仅揭示了Complex I在质粒上的"搭便车"现象,还发现了古菌中特殊的"简化版"Complex I,为理解能量代谢系统的进化提供了革命性见解。

研究人员采用多管齐下的技术策略:首先从NCBI基因组数据库筛选47,278个高质量原核基因组,通过MMseqs2进行序列聚类消除物种偏差;利用MAFFT构建多序列比对并开发亚基特异性HMM模型;采用HMMER对预测的蛋白质组进行系统搜索;结合基因组共定位分析(最大间隔250bp)和核密度估计(KDE)确定置信阈值;通过AlphaFold3预测质粒编码亚基的结构验证;最后运用最大似然法构建系统发育树分析进化关系。

结果与发现

原核基因组数据集优化

研究团队建立了严格的基因组筛选标准,从729,850个记录中精选47,278个"完整基因组"或"染色体级别"组装,涵盖10,608种细菌和431种古菌。通过N50值评估确保数据质量,为后续分析奠定基础。

潜在Nuo亚基的精准识别

创新性地采用85%序列同一性的聚类策略消除研究偏见,构建的16个HMM模型(含融合亚基)展现出卓越的特异性。核密度分析揭示的e值多峰分布,使研究者能区分真正Nuo亚基与同源蛋白(如HycG),解决了长期困扰领域的同源干扰问题。

高置信度Nuo亚基的鉴定

通过基因组共定位原则,发现当亚基间距≤250bp时,含全部14亚基的"Nuo-Complete"集群达到稳定平台。这种基于生物学背景的过滤策略,比传统e值阈值更可靠地识别出功能相关的亚基组合。

Nuo亚基的分布特征

突破性发现5,428种细菌具有完整Complex I,远超既往报道的418种。特别值得注意的是,在Rhodopseudomonas palustris等45个物种中发现两套完整Complex I系统,暗示代谢多样性需求。古菌中则存在缺失N模块(负责NADH氧化的关键部分)的特殊变体,如甲烷微菌类(Methanomicrobia)利用F420H2而非NADH作为电子供体。

C-I变异体与分类群的关联

系统发育分析将Complex I分为五大进化枝,其中γ-变形菌纲(Gammaproteobacteria)的分化尤为引人注目。现代菌株普遍存在NuoCD融合亚基,而古老菌株则保持独立亚基形式,印证了"功能趋同驱动基因融合"的进化理论。

C-I变异体与代谢特征的关联

严格的好氧菌与完整Complex I显著相关(p<0.001),而厌氧菌偏好含融合BCD亚基的变体。微需氧菌如Campylobacter jejuni则依赖黄素氧还蛋白替代NADH氧化的特殊适应机制。

质粒携带的Nuo亚基

首次报道57个物种的质粒携带Nuo亚基,其中17个具有完整Complex I基因簇。通过AlphaFold3结构预测证实,质粒编码的亚基(如Komagataeibacter saccharivorans)与染色体版本结构高度保守(RMSD<1?),为水平基因转移提供了分子证据。

线粒体Complex I附属亚基的进化线索

在1,402种细菌中发现线粒体附属亚基(如NDUFA9、A12、S4),其中1,279种为α-变形菌纲。这一分布模式支持"线粒体附属亚基在内共生事件前已开始分化"的新假说。

这项研究如同拼凑出了一幅宏大的"分子进化全景图":Complex I可能起源于古菌中简单的PQ模块组合,随后通过基因复制(如MrpA/D产生NuoL/M/N)和模块添加(获得NADH氧化的N模块)逐步完善。质粒携带的亚基揭示了水平转移在进化传播中的作用,而附属亚基在α-变形菌中的广泛存在,则暗示线粒体复杂化的前奏早已在原核祖先中奏响。这些发现不仅改写了生物能量代谢的进化教科书,更为理解病原体代谢脆弱性、开发新型抗菌靶点提供了分子蓝图。研究者开发的HMM工作流程和交互式数据库(prokcomplexone.streamlit.app),将成为探索其他复杂系统进化的典范工具。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号