极端环境驱动微生物基因组特征趋同:跨域最大分化微生物的k-mer特征研究

《NAR Genomics and Bioinformatics》:Life at the extremes: maximally divergent microbes with similar genomic signatures linked to extreme environments

【字体: 时间:2025年12月24日 来源:NAR Genomics and Bioinformatics 2.8

编辑推荐:

  本研究针对极端环境下微生物基因组适应性机制尚不明确的问题,开发了一种基于复合基因组代理和k-mer频率向量的计算流程,发现6-mer和100 kbp基因组代理长度能在分类精度和计算效率间达到最佳平衡。研究通过多层筛选识别出15对最大分类差异(细菌-古菌)但基因组特征相似的微生物对,证实极端环境压力可在全基因组水平上产生跨域趋同的序列模式,为环境适应性基因组演化提供了新见解。

  
在地球上最严酷的环境中,存在着一类被称为“极端微生物”的生命形式,它们能够在高温、高酸、高辐射等极限条件下繁衍生息。这些微生物不仅是生命适应能力的奇迹,更是研究环境压力驱动基因组演化的天然实验室。然而,一个长期困扰科学家的问题是:当来自完全不同进化谱系的微生物面临相似的环境压力时,它们的基因组是否会展现出趋同的适应特征?这种环境驱动的基因组特征是否能够超越传统的分类学界限?
近日发表在《NAR Genomics and Bioinformatics》上的研究给出了令人振奋的答案。由Monireh Safari领衔的研究团队开发了一套创新的计算生物学方法,发现极端环境压力确实能够在最大分类差异的微生物间产生相似的基因组特征,这一发现挑战了我们对基因组适应性的传统认知。
研究团队采用了几项关键技术方法:首先,他们构建了一个包含693个极端微生物基因组的精选数据集,涵盖不同温度(嗜冷、嗜中温、嗜热、超嗜热)和pH(嗜酸、嗜碱)适应性的微生物。其次,他们提出了一种新的“复合基因组代理”选择方法,通过伪连接多个随机选择的非连续基因组片段来代表整个基因组。第三,研究使用k-mer频率向量作为基因组特征,并系统评估了不同k-mer大小(1-9)和基因组代理长度(10-1000 kbp)对分类性能的影响。最后,他们结合多种无监督聚类算法和FCGR(Frequency Chaos Game Representation)图像比较,识别具有相似基因组特征的微生物对。
基因组代理选择的优化研究结果表明,随机选择基因组片段构建复合基因组代理的方法不会影响分类准确性,且分类结果在不同运行间方差极小。这一发现证实了基于k-mer的基因组特征在整个基因组中具有普遍性,即使使用仅100 kbp的短片段(约为平均基因组长度的1/35),也能有效捕获分类和环境适应性信息。
最优k-mer大小和基因组代理长度的确定通过系统评估发现,当k-mer大小从1增加到6时,分类准确性显著提升;而当k大于6时,分类性能的提升趋于平缓,且对于短序列会出现性能下降。综合考虑计算效率和分类性能,研究确定k=6为最优选择。在基因组代理长度方面,100 kbp在各种分类任务中表现最佳或接近最佳,且其性能与使用完整基因组相当,表明100 kbp的复合基因组代理能够在保持高精度的同时大幅降低计算成本。
最大分化微生物对的识别通过多层筛选流程,研究最终确定了15对“环境相关”的细菌-古菌对,这些微生物对尽管来自不同的生命域,却展现出相似的基因组特征。这些对可分为5组,其中前3组主要由极端环境微生物(如超嗜热、嗜热嗜酸菌)组成,而后2组主要为嗜中温微生物。
3-mer频率谱分析显示,这些微生物对在3-mer使用上表现出显著相似性。特别是在极端环境微生物对中,观察到的3-mer过表达或低表达模式与已知的极端微生物密码子使用偏好一致。例如,在嗜热嗜酸菌对中,“CAA”(谷氨酰胺密码子)的过表达和“ACG”(苏氨酸密码子)的低表达与已知的嗜热菌氨基酸组成特征相符。Spearman等级相关系数分析进一步证实了这些对之间3-mer频率模式的显著相关性(P<10-5)。
地理共现分析发现,多个识别出的微生物对在自然环境中确实共同存在。例如,第1组中的物种在黄石国家公园的Washburn热泉中被同时发现,而第2组物种在Brothers海底火山和Juan de Fuca海脊均有共现记录。这些共现环境与物种原始分离环境具有相似的环境压力,支持了基因组特征相似性与环境适应性相关的假设。
这项研究的结论深刻揭示了环境压力在塑造微生物基因组组成中的主导作用。研究发现,极端环境适应性会在整个基因组层面留下可检测的“印记”,这些印记能够超越传统的分类学界限,在最大进化距离的微生物间产生趋同的基因组特征。通过创新的计算生物学方法,研究不仅证实了基因组特征在环境适应性研究中的价值,还为理解环境压力驱动基因组演化的机制提供了新视角。
研究的讨论部分进一步指出,尽管水平基因转移是极端环境适应的重要机制,但BLAST分析显示识别出的微生物对间几乎没有共享遗传物质,表明观察到的基因组特征相似性更可能是由相似的环境选择压力而非直接的基因交流所致。这一发现强调了环境选择在驱动基因组组成趋同中的独立作用。
该研究的创新之处在于将计算生物学方法与深入的生物学验证相结合,不仅提出了检测环境驱动基因组特征的新方法,还通过多维度验证证实了这些特征的功能相关性。未来研究可进一步探索这些共享基因组特征背后的具体分子机制,以及它们在生物技术应用中的潜力,如设计适应极端条件的合成微生物或优化工业酶的生产。
总之,这项研究为我们理解生命在极端条件下的适应策略提供了重要见解,架起了计算生物学与实验生物学之间的桥梁,为极端环境微生物研究开辟了新的方向。随着更多极端环境微生物基因组的测序和分析,我们有望发现更多环境驱动基因组演化的规律,最终揭示生命适应极端环境的普遍原理。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号