
-
生物通官微
陪你抓住生命科技
跳动的脉搏
海洋微生物暗物质中古老蛋白家族的高度分化环境同源物揭示生命进化新线索
【字体: 大 中 小 】 时间:2025年06月12日 来源:Environmental Microbiome 6.3
编辑推荐:
本研究针对海洋微生物"暗物质"中未注释蛋白的难题,采用迭代网络同源搜索技术,在40 million ORFs数据集中发现53个古老基因家族存在与古菌-细菌分化相当的高度变异环境同源物,包括SMC染色体维持蛋白新结构变体、DNA聚合酶夹装载体深分支簇和细菌/病毒重组酶变异体,为理解生命核心功能的进化多样性提供了新视角。
在微生物学研究领域,超过99%的微生物仍无法通过传统培养方法获得,这些"微生物暗物质"构成了生命之树中缺失的重要环节。随着宏基因组测序技术的发展,科学家们陆续发现了CPR细菌、DPANN古菌和Asgard古菌等全新类群,彻底改变了我们对生命树结构的认知。然而,即便在这些突破之后,海洋宏基因组中仍有大量蛋白质序列既缺乏分类学注释又缺乏功能注释,特别是在全球海洋微生物参考基因目录(OM-RGC)中,约45%的序列无法确定域级分类地位。
这种认知空白提出了一个关键科学问题:在那些被认为高度保守、几乎与细胞生命同样古老的蛋白家族中,是否仍存在未被发现的巨大遗传多样性?这些潜在的新变异可能来自未知生命分支、病毒或特殊功能分化,对理解生命核心机制的进化具有重要意义。
来自法国索邦大学等机构的研究团队在《Environmental Microbiome》发表创新性研究,通过开发迭代网络同源搜索方法,系统挖掘了海洋环境中53个古老蛋白家族的远缘同源物。研究发现近半数家族存在与古菌-细菌分化相当的高度变异环境同源物,包括结构异常的染色体维持蛋白、深分支的DNA聚合酶组分和病毒源重组酶等。这些发现表明,即使在最保守的核心蛋白家族中,海洋环境仍蕴藏着惊人的未开发多样性,为探索生命进化提供了新线索。
研究采用三项关键技术方法:(1)从9.7 million蛋白序列中筛选53个古老保守家族作为种子;(2)在OM-RGC v1数据库(含40 million ORFs)中进行迭代DIAMOND同源搜索,通过序列相似性网络(SSN)分析环境同源物;(3)结合结构预测(ColabFold)、单细胞基因组(GORG-Tropics)和病毒数据库(GOV 2.0)验证变异体的生物学起源。
结果部分:
海洋宏基因组包含古老蛋白家族的远缘同源物
迭代搜索从OM-RGC中获得826,717条环境同源序列,平均需7轮搜索达到饱和。20.5%的环境同源物与最近已知同源物的相似度低于古菌-细菌平均水平(34.9%),核糖体蛋白家族变异最小但仍包含极端变异体。地理分布分析显示这些高度变异序列均匀分布于全球各海域,在印度洋中深层水域富集程度最高(+42%)。
DNA聚合酶夹装载体的新环境分支
在AAA+ATPase家族(含细菌DnaX/HolB、古菌RfcS和真核RFC2-5)中鉴定出10个高度变异簇。系统发育显示7个簇位于细菌和古菌/真核参考序列之外,其中簇26和27与噬菌体序列高度相似,可能代表病毒特异的夹装载体变异。结构预测显示环境变异体形成独立于已知结构的折叠群,如簇24形成独特的三维构象。
放线菌中异常丰富的无铰链SMC蛋白
发现一个仅占总数0.97%但丰度极高的环境变异簇(簇9),其序列与放线菌SMC同源但完全缺失关键的铰链结构域。结构比较(TM-score=0.44 vs 参考SMC)证实这些"无铰链"SMC与Rad50/SbcC家族也不同,代表一种全新的染色体组织蛋白构型。单细胞基因组分析排除了基因重复假说,提示可能来自未知放线菌分支。
亚微米级组分中的重组酶变异体
RecA/RadA家族中发现4个高度变异簇(1700条序列),其中簇5和19主要来自<0.2 μm粒径组分,与巨型病毒(如Chrysochromulina ericina病毒)序列相似。簇20在系统发育上接近古菌RadA根基,却在蓝菌、变形菌等细菌单细胞基因组中作为旁系同源基因存在,暗示水平基因转移事件。
结论与意义
该研究通过创新的网络同源搜索策略,揭示了海洋微生物暗物质中古老蛋白家族的惊人多样性。三个关键发现尤其值得关注:(1)DNA复制机器核心组分存在病毒特异的深分支变异,为理解病毒与宿主协同进化提供线索;(2)放线菌中广泛存在的无铰链SMC挑战了染色体组织蛋白的结构-功能范式;(3)亚微米级组分中重组酶的病毒起源变异,暗示海洋病毒库存在独立的DNA修复机制。
这些发现从三个层面拓展了微生物学认知:方法论上证明网络分析能有效挖掘高度分化同源物;理论上提示核心生命功能的进化空间比预期更广阔;应用上为后续寻找新微生物类群提供了分子标记。研究还提出了若干待解问题,如无铰链SMC的功能机制、病毒重组酶的生物学意义等,为未来研究指明了方向。随着AlphaFold等结构预测工具的发展,将环境序列与预测结构相结合的"3D相似性网络"可能成为探索微生物暗物质的下一个突破口。
生物通微信公众号
知名企业招聘