蓝细菌远红光光适应的演化:解锁早期地球生命奥秘

【字体: 时间:2025年05月14日 来源:Current Biology 8.1

编辑推荐:

  本文聚焦蓝细菌远红光光适应(FaRLiP)的演化。通过挖掘序列数据、分析基因和基因组树等,发现其在早期元古宙就已出现,主要通过垂直遗传,且存在保守调控基序。该研究对理解地球早期生命和蓝细菌演化意义重大。

  

引言


蓝细菌在地球生命演化进程中占据着举足轻重的地位,它是重要的初级生产者,在地球大气的氧化过程中发挥了关键作用,这一过程被称为大氧化事件(Great Oxygenation Event)。从古老的化石叠层石中,能找到蓝细菌早期活动的痕迹,分子钟数据结合化石记录推测,蓝细菌的最后共同祖先大约存在于 23 - 34 亿年前。此后,蓝细菌不断分化,广泛分布于各种极端环境,从营养匮乏的开阔海洋到干旱沙漠的岩石内部,都有它们的踪迹。

在众多光适应机制中,远红光光适应(Far - Red Light Photoacclimation,FaRLiP)是一种特殊的现象。部分蓝细菌可利用远红光(700 - 750nm)进行光合作用,这依赖于红移叶绿素(叶绿素 d 和叶绿素 f)以及约 20 个基因组成的基因簇。这些基因编码参与光合作用的多种关键蛋白,如光系统 I(PSI)、光系统 II(PSII)、藻胆体(phycobilisomes)和光敏色素信号级联(phytochrome signaling cascade)的相关蛋白。尽管 FaRLiP 在蓝细菌中具有重要意义,但它在物种树中所占比例较少(约 4%),其演化历程一直存在诸多争议,早期研究认为它可能主要通过水平基因转移(Horizontal Gene Transfer,HGT)传播,不过也有观点强调垂直遗传(vertical descent)的重要性,然而此前的数据并不足以充分支持这一观点。本研究旨在通过深入探究 FaRLiP 基因的分布、系统发育和排列,以及基因间区域的系统发育,来揭开其演化的神秘面纱。

结果


  1. FaRLiP 与微生物岩和微生物垫的关联:研究人员从多种来源成功获取了 51 个新的完整或近乎完整的 FaRLiP 基因簇,极大地丰富了研究数据。这些基因簇来源广泛,包括 NCBI 数据库、培养菌株、序列读取存档(Sequence Read Archive,SRA)的原始数据以及实验室富集的分离株。环境样本分析显示,微生物岩(包括叠层石和凝块石)和非石化微生物垫是 FaRLiP 基因簇的重要来源,约占一半。例如,墨西哥的阿尔奇奇卡湖(Alchichica Lake)和南非的开普雷菲 / 舍恩马克斯科普(Cape Recife/Schoenmakerskop)的叠层石样本中,FaRLiP 基因多样性十分显著。此外,研究还发现微塑料相关的序列对于恢复早期分支丝状蓝细菌(如 Nodosilineales 和 Oculatellales)的数据至关重要,有助于深入了解早期 FaRLiP 的演化。
  2. FaRLiP 基因演化支持垂直遗传:FaRLiP 基因簇包含 19 - 24 个基因,其中 19 个核心基因在所有已知具有完整 FaRLiP 基因簇的蓝细菌中都存在。通过对这 19 个核心基因构建系统发育树,发现编码藻胆体 - 光系统连接蛋白的 apcE2 基因树与物种树高度匹配,有力地支持了 FaRLiP 基因从共同祖先垂直遗传的观点。尽管不同核心基因树之间存在一些差异,但大部分差异可以通过基因的进化速率和大小来解释。例如,较大且进化速率适中的基因,其基因树与物种树的一致性更高。对于之前认为光合系统 I(PSI)基因进化存在差异并可能通过 HGT 传播的观点,研究重新分析后发现,PSI 基因进化速率的差异导致了系统发育重建的困难,而非 HGT 的结果。此外,研究还发现了一些额外的 FaRLiP 相关基因,如 psbF2 和 rfpD,它们的序列也与核心 FaRLiP 基因和物种树相似,进一步支持了所有基因共同遗传的观点。
  3. FaRLiP 基因簇结构揭示演化模式:FaRLiP 基因的排列(synteny)在不同蓝细菌类群中呈现出与基因组树一致的保守模式,这为垂直遗传提供了进一步的证据。通过对基因排列的分析,研究将 FaRLiP 基因簇分为六个组(I - VI),每个组都有其独特的基因排列特征,同时也存在一些保守的共性,如 apc 基因和 psbD/C/B 基因的相对顺序。通过对这些特征的分析,研究推测出了祖先 FaRLiP 基因簇可能的组成和结构,包括 chlF 与下游 PSI 基因的共转录、藻蓝蛋白基因与下游 PSII 基因的共转录等。
  4. FaRLiP 基因通过古老基序在操纵子中共同调控:研究表明,FaRLiP 基因簇可能通过操纵子进行共转录,具有保守的调控结构。通过对 14 个元转录组的分析,发现了多基因 mRNA 的存在,这表明部分基因可能作为操纵子共同转录。此外,研究还在 FaRLiP 基因间区域鉴定出一类保守的富含 T 的基序,这些基序可能与调控蛋白 RfpB 相互作用,促进基因转录。系统发育分析显示,这些基序可能起源于祖先的 chlF 基序,并通过重复复制演化而来,在不同的基因上游发挥调控作用,且部分基序可能在 22 - 25 亿年前的共同祖先中就已存在。

讨论


本研究确凿地证明了 FaRLiP 是蓝细菌演化早期的表型,至少在其共同祖先(most recent common ancestor,MRCA)时期就已存在,早于 Nodosilineales 从蓝细菌物种树中分化出来的时间。与另一种远红光光合蓝细菌 Acaryochloris 不同,FaRLiP 在蓝细菌中分布更为广泛。基因树、基因排列和 GC 含量等多方面的证据都支持 FaRLiP 基因的垂直遗传。在 FaRLiP 基因簇的演化过程中,chlF 合酶基因起着至关重要的作用,尽管之前认为 PSI 基因可能是后来通过 HGT 获得的,但本研究并不支持这一观点。

FaRLiP 基因簇的调控相对简单,由一类高度保守的同源基因间基序负责大部分调控工作。与可见光相关的基因相比,FaRLiP 基因簇的结构更为紧凑,功能模块更为集中,这使得它在不使用时更易于维持和保存。此外,基因在特定保守方向上的排列可能与光系统组件的替换速率有关,例如 PSII 中不同蛋白的受损程度和替换顺序可能影响了基因的排列方式,但转录调控在细菌中对最终产物的影响程度仍存在争议。

综合来看,FaRLiP 基因簇很可能存在于早期分化蓝细菌的共同祖先中,这一时期与叠层石多样性的增加相吻合。现代微生物岩中 FaRLiP 物种的存在和转录本的发现,表明 FaRLiP 在元古宙叠层石的形成过程中可能发挥了重要作用。此后,FaRLiP 蓝细菌在全球范围内不断分化,广泛分布于各种生态环境中,包括海洋微塑料、森林树冠和洞穴内部等,尤其是在各种微生物垫和现代微生物岩中。

资源可用性


本研究中的数据和代码已公开,方便其他研究人员进一步分析和探索。微生物基因组组装(Metagenome - Assembled Genomes,MAGs)以及新测序的 FaRLiP 基因簇已提交至 NCBI 数据库和 Figshare 平台。所有原始代码可在 GitHub 上获取,如需更多信息,可联系主要联系人 Dennis J. Nürnberg(dennis.nuernberg@fu - berlin.de)。

研究方法


  1. 蓝细菌样本:研究使用了来自 CCAP/SAMS(英国)和 PCC(法国)培养 collection 的蓝细菌菌株,以及从环境样本中分离的三株菌株(CL0、CL1 和 WS17)。通过 BLAST 搜索 ApcE2 或其他 FaRLiP 蛋白序列,筛选出含有 FaRLiP 基因的菌株,并在特定光照条件下进行富集培养。
  2. 环境分类:对 86 个 FaRLiP 基因簇进行环境分析,根据基因簇的完整性和序列多样性进行筛选,去除相同环境中的重复序列,将其分为微生物岩、微生物垫、其他和未知四类。
  3. DNA 提取:针对不同来源的样本,采用不同的 DNA 提取方法。如对于富集样本,使用 Quick - DNA Fungal/Bacterial Miniprep Kit 提取基因组 DNA,并通过延长珠磨步骤和移液器破碎来提高提取效果;对于 CCAP 和 PCC 菌株,则分别按照相应试剂盒的说明进行操作。
  4. (元)基因组测序:对不同样本采用不同的测序方法和平台。例如,CL0 样本同时使用 Illumina 和 Oxford Nanopore 进行测序,CL1 和 WS17 样本使用 Illumina 测序,CCAP 菌株使用 Illumina NovaSeq 6000 测序,PCC 菌株使用 Illumina NextSeq500 系统测序。
  5. (元)基因组组装:根据样本特点和数据来源,使用不同的软件进行基因组组装。如对于分离株和序列数据库中的数据集,使用 BBDuk 进行质量修剪,然后分别用 MEGAHIT、SPADES 或 Unicycler 进行组装;对于 CCAP 菌株,使用基于 metaWRAP 的元基因组管道进行预处理和组装;对于 PCC 菌株,使用 fq2dna v21.06 进行组装。
  6. 元基因组分箱和质量控制:对于 CCAP 菌株,采用 Concoct、MaxBin2 和 MetaBat2 进行集成元基因组分箱;对于分离株和其他数据集,使用 vamb 进行共分箱。通过 CheckM 检查分箱质量,使用 anvi’o 进行手动优化,去除重复分箱,并对最终的分箱进行验证、分类和注释。
  7. 数据库来源:主要使用 NCBI(nr、WGS 和 SRA)和 IMG/MER 数据库。通过 BLASTp 和 tBLASTn 搜索,以远红特定的 ApcE2 基序 VIPEDV 为查询序列,结合其他 FaRLiP 基因和基序的搜索,获取相关基因和基因簇信息,并使用 MAFFT 和 SplitsTree 5 软件进行序列分析和网络构建。
  8. 基因水平的系统发育分析:对 19 个核心 FaRLiP 基因进行 DNA 和蛋白质序列比对,使用 MAFFT 和 SeqKit 进行序列管理,通过 IQ - TREE 构建系统发育树,并采用 HoT 方法评估序列比对的可靠性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号