单细胞转录组学研究揭示了在碎屑食物网中,多种功能基因从原核生物横向转移到自由生活的纤毛原生生物的过程
《Marine Life Science & Technology》:Single-cell transcriptomics reveals lateral transfers of multiple functional genes from prokaryotes to free-living ciliated protists in detrital food webs
【字体:
大
中
小
】
时间:2026年05月17日
来源:Marine Life Science & Technology 5.3
编辑推荐:
摘要
侧向基因转移(LGT)是进化创新的关键驱动力,它决定了厌氧环境中原生生物的生活方式及其相互作用。然而,其在自由生活原生生物中的重要性仍尚未得到充分研究。在这里,我们通过提供Metopus yantaiensis的首个单细胞转录组以及来自九种厌氧APM纤毛虫(Armoph
摘要
侧向基因转移(LGT)是进化创新的关键驱动力,它决定了厌氧环境中原生生物的生活方式及其相互作用。然而,其在自由生活原生生物中的重要性仍尚未得到充分研究。在这里,我们通过提供Metopus yantaiensis的首个单细胞转录组以及来自九种厌氧APM纤毛虫(Armophorea、Muranotrichea和Parablepharismea类)的36个组学数据集的全基因组LGT筛查,填补了这一空白——这些纤毛虫主要存在于土壤/沉积物环境中。通过系统发育分析和验证测试,我们识别出63个在APM纤毛虫中优先富集的候选原核LGT基因。其中19个基因形成了降解复杂有机物(多糖、氨基糖)的相互连接的途径;它们的高多样性和完整性在已报道的原生生物LGT中非常罕见。一个罕见的融合基因(arcC-OTC)和两个新基因(acs、ME2)仅在APM纤毛虫中被发现,这可能是首次证明LGT介导的碳代谢物保留和吞噬性原生生物中氨同化的证据。值得注意的是,27个LGT基因(包括arcC-OTC、acs和ME2)可追溯到候选CPR细菌或已描述的原核生物,标志着首次记录了从CPR到真核生物的LGT。总体而言,这63个LGT基因预计可以增强营养物质的利用(复杂有机物、其他碳代谢物、无机元素)、生物能量效率以及抗逆性(重金属、氧气),从而促进土壤/沉积物的适应。总体而言,我们的结果强调了侧向原核基因获取对于自由生活的厌氧纤毛虫适应新环境的重要性,为理解原生生物的进化动态和生态角色提供了新的见解。
引言
侧向基因转移(LGT)越来越被认为是真核生物进化新性的主要驱动力(Husnik和McCutcheon 2018;Keeling 2009, 2024)。从原核生物到原生生物的LGT——主要是既不是动物也不是植物或真菌的单细胞真核生物——是一个值得关注的领域。这是因为这些生物与原核生物之间存在频繁的生物相互作用和直接物理接触,包括捕食和内共生(Keeling 2009, 2024)。已有文献记录了原核生物与多种原生生物群体之间的基因转移,包括极端微生物(例如适应冰环境的或嗜热的藻类)(Dorrell等人2023;Raymond和Kim 2012)、寄生虫(例如Giardia和Blastocystis)(Alsmark等人2013;Eme等人2017)以及硅藻(Vancaester等人2020)。尽管许多研究集中在寄生或共生的原生生物上,但对于自然环境中自由生活的异养原生生物物种中的LGT的身份和潜在作用知之甚少(Vancaester等人2020;Xu等人2016)。土壤微生物组在元素生物地球化学循环中起着关键作用,产生和消耗温室气体(如CO2、CH4和N2O),并维持植物、动物和人类的健康(Banerjee和van der Heijden 2023;Jansson和Hofmockel 2020)。原生生物在土壤中普遍存在且数量众多,它们在细菌捕食、食物网动态和营养再矿化中发挥着重要作用(Geisen等人2015, 2018)。单细胞组学方法已成为阐明原生生物生理学、生态学和进化的强大工具(Gao等人2025;Kolisko等人2014;Lyu等人2024;Ma等人2025;Wang等人2026;Zhang等人2025b;Zheng等人2025)。然而,关于土壤原生生物的研究远远落后于海洋原生生物的研究(Geisen等人2015, 2018)。特别是,关于自由生活的异养土壤栖息原生生物物种的转录组数据仍然很少(Lax等人2018)。
纤毛虫是土壤和沉积物微生态及中生态系统中最主导和多样化的原生动物之一,在物质和营养物质的流动中起着重要作用(Acosta-Mercado和Lynn 2004;Feng等人2025;Liu等人2025;Ma等人2025)。在这项研究中,我们生成了Metopus yantaiensis的单细胞转录组,这是一种在土壤中广泛分布的著名纤毛虫属的成员(Foissner等人2002)。结合来自另外九种厌氧APM纤毛虫(Armophorea、Muranotrichea、Parablepharismea类)的36个组学数据集的全基因组筛查,我们识别出63个原核/病毒来源的候选LGT基因,这些基因在APM纤毛虫中独特富集。我们的分析揭示了参与营养物质利用、能量代谢和抗逆性的细菌、古菌和病毒来源的基因。这些发现突显了自由生活原生生物在陆地和沉积物生态系统中的先前未被认识的生物地球化学潜力。
材料与方法
**生物来源**
Metopus yantaiensis是从中国山东烟台的一个沿海苹果园的土壤中分离出来的(Omar等人2017)。收集了含有少量凋落物的表层土壤并风干。使用Foissner等人(2002)描述的非淹没培养皿方法对干燥的土壤样本进行了处理。添加了干燥的灭菌草屑以增加细粒土壤的有机物含量和过滤能力。用微量移液器挑选了一些纤毛虫细胞,清洗后接种到含有灭菌切碎草的矿泉水中以建立初始培养。
**互补DNA(cDNA)文库和测序、DNA提取**
尽管Metopus yantaiensis可以在实验室中培养,但从不含其他微生物污染物的土壤培养基中分离出足够的细胞仍具有挑战性。因此,我们使用Smart-seq2协议(Kolisko等人2014;Picelli等人2014)对两个单细胞(分别称为C1和C2)的转录组进行了单细胞扩增。用微量移液器挑选了两个平均细胞大小的个体,用0.22 μm过滤的矿泉水清洗三次,然后饥饿3小时以完全消化摄入的猎物。全长cDNA文库的生成和测序过程详见补充文本和表S1。
对于另外三个经过清洗和饥饿处理的M. yantaiensis个体,使用Omar等人(2017)的方法,通过REDExtract-N-Amp Tissue PCR Kit(Sigma,St. Louis,MO)提取了基因组DNA,以便通过聚合酶链反应(PCR)进一步验证LGT,并扩增用于PacBio测序的M. yantaiensis相关细菌的16S rRNA基因。
**单细胞转录组的组装和完整性评估**
使用内部脚本(Novogene,北京)修剪了测序适配器,并过滤掉了低质量读段(N含量>10%,低质量碱基>50%)。使用Trinity v2.12.0和标准设置组装了干净的数据集(C1的99.5%,C2的99.08%)。为了评估SCT引入的潜在偏差并计算表达水平(FPKM),使用Bowtie 2(Langmead等人2009)和SAMtools v1.3(Li等人2009)将读段映射回组装结果,两者均使用默认设置。丢弃了读段计数低于2的unigenes(C1为4993个,C2为8602个)。
为了去除潜在污染物并识别初步的LGT候选基因,使用BLASTx将独特基因与国家生物技术信息中心(NCBI)的非冗余蛋白质(nr)数据库(2024年12月)进行比对,e值截止值为1.00E-10。将与非原生生物具有高身份(≥80%)和覆盖度(≥50%)的序列视为污染物并移除(C1为1867个,C2为930个)(Kolisko等人2014)。
为了评估SCT的完整性,使用了包含20个tRNA合成酶和248个真核核心蛋白的两个参考数据集(http://korflab.ucdavis.edu/Datasets/genome_completeness/)(Kolisko等人2014)。此外,还使用了之前发表的Nyctotherus ovalis培养物的EST数据及其注释的线粒体蛋白数据集(Boxma等人2005;De Graaf等人2011),因为根据18S rRNA基因的系统发育关系,M. yantaiensis与N. ovalis密切相关(Omar等人2017)。使用互惠BLASTx搜索将M. yantaiensis SCT的unigenes与这些参考数据库进行比对,e值截止值为1.00E-10。此外,还使用BUSCO版本4.1(Sim?o等人2015)和Alveolata数据库(alveolata_odb10)评估了SCT的完整性。基于合格的SCT,我们使用工作流程估计了M. yantaiensis通过侧向基因转移从原核生物获得的unigenes的比例(图1)。
**图1**
该图像的替代文本可能是使用AI生成的。
**全尺寸图像**
用于识别Metopus yantaiensis转录组中侧向基因转移(LGTs)的分析流程示意图。显示了每个过滤步骤后保留的unigenes数量。
**M. yantaiensis中的LGTs及其在厌氧纤毛虫中的同源物的初步筛查**
BLASTx返回了1140个unigenes,其中前三名 hit 均为细菌或古菌来源;这组包括在早期筛选步骤中被预测为原核生物污染物的360个unigenes(图1)。这1140个unigenes被选为来自原核生物的初级LGT候选基因,并被翻译成蛋白质。在翻译之前,使用Augustus 3.4.0(Stanke和Morgenstern 2005)对两个M. yantaiensis SCT cDNA进行了分析,以确定转录本末端的终止密码子使用偏好。两个转录本都偏好“UAA”(分别为76.7%和83.4%),这与Euplotes的报告偏好一致(Jin等人2023)。因此,使用ExPASy Translate(Gasteiger等人2003)和Euplotes代码10对这些LGT候选基因进行了翻译;阅读框取自得分最高的BLASTx比对结果。
**确认转移基因在系统发育上与M. yantaiensis相关的厌氧纤毛虫中固定**
为了确认转移基因在系统发育上与M. yantaiensis相关,我们筛查了36个最近发表的厌氧纤毛虫转录组和基因组(图1;补充表S2)。该数据集包括九种APM类群(Armophorea、Muranotrichea、Parablepharismea)以及三个外群分类单元(Trimyema finlayi、Plagiopyla frontata和Cyclidium porcatum)(Lewis等人2020;Rotterová等人2020)。原始读段使用Trinity v2.12.0/Metaspades v3.13.1按照原始出版物中报告的相同设置重新组装(Lewis等人2020;Rotterová等人2020)。使用BLASTx搜索M. yantaiensis LGT候选基因与数据集中的同源序列(e值≤1E-10,覆盖度≥50%)。转录本使用ExPASy(Gasteiger等人2003)进行翻译,基因组支架使用Augustus 3.4.0(Stanke和Morgenstern 2005)进行注释。这两个步骤都使用了基于APM类群中终止密码子使用保守性的Euplotes核代码10(Jin等人2023)。丢弃了在至少一个厌氧纤毛虫物种中没有同源物的候选基因;剩余的基因集被用于系统发育分析(图1)。
**系统发育分析和系统发育树解释**
为了收集足够的同源序列进行系统发育分析,分别使用每个M. yantaiensis LGT候选蛋白作为查询,对NCBI-nr数据库进行了三次独立的BLASTp搜索(2024年12月版本)。对于每次BLASTp搜索,应用了分类学过滤器,将hit限制在Eukaryota、Bacteria和Archaea(e值≤1E-5,每次搜索最多2000个hit)。还进行了额外的tBLASTn搜索,针对NCBI非冗余核苷酸(nt)数据库(2024年12月版本),不施加分类学限制(e值≤1E-5,最多100个hit)。我们还筛查了来自海洋微生物真核生物转录组测序项目(MMETSP;Keeling等人2014)的21个好氧纤毛虫转录组(补充表S3),以寻找纤毛虫的同源序列(e值≤1E-5,最多1000个hit)。保留了序列重叠率>50%的hit作为所有BLAST结果的参考序列。MMETSP转录本和tBLASTn核苷酸hit分别使用纤毛虫代码(6)和标准代码(1)通过ExPASy进行翻译。为了构建系统发育树,将M. yantaiensis LGT蛋白、厌氧纤毛虫同源物和所有参考数据集组合在一起。使用cd-hit(Li和Godzik 2006)将相似的蛋白质序列去除,将数据集减少到大约200-500个序列。
**curated datasets**
使用MAFFT版本7对整理后的数据集进行了比对,并根据比对质量对输出序列进行了排序(Kuraku等人2013)。后续使用BMGE-1.1软件,结合BLOSUM30替换矩阵和4的块大小,对比对结果进行了修剪,以去除比对不明确的区域(Criscuolo和Gribaldo 2010)。最终保留了长度超过80个氨基酸且包含超过30个参考序列的比对结果,用于进一步的系统发育分析。最大似然分析使用IQ-tree v1.4.4软件进行(Nguyen等人2014),采用的替换模型为LG+C60、LG+C20或LG4X,具体模型参数由ModelFinder Plus根据贝叶斯信息准则选择(补充表S4)。分支支持度通过超快自举法(1000次重复)和SH类近似似然比测试(SH-aLRT;1000次重复;Guindon等人2010)进行评估。每个确定的LGT的比对细节和用于系统发育分析的模型在补充表S4中列出。根据IQ-TREE手册,当UFboot≥95%和SH-aLRT≥80%时,认为分支得到良好支持。如果M. yantaiensis的蛋白质与至少一种其他APM纤毛虫物种形成稳健的支系,并且:APM与具有高支持度的原核序列聚类;这些序列主要由原核序列和APM支系的成员序列组成;和/或APM支系的序列与具有高支持度的远缘真核谱系的序列聚类,则推断该蛋白质可能来自原核生物(Fig. 1;Eme等人2017;Ricard等人2006;Xu等人2016)。
为了排除残留的原核污染,我们对每个M. yantaiensis和APM LGT编码的转录本/支架进行了真核或纤毛虫特征的筛查(即PolyA尾、内含子及其侧翼CDS的真核或纤毛虫归属)(Eme等人2017;Xu等人2016)(Fig. 1)。使用自定义的Python脚本(附加数据)扫描转录本;只有以≥6个连续腺嘌呤结尾的序列被标记为真核序列。使用Augustus 3.4.0(Stanke和Morgenstern 2005)和Euplotes代码(Jin等人2023)预测基因组支架中的剪接位点;存在典型的内含子证实了其核起源。查询每个候选基因上游和下游的预测CDS在NCBI nr中的数据(e值≤1E-10);结果需要与真核生物或优选地与纤毛虫相关联。这些检查进行了两次:(1)在初始同源物检索过程中以去除污染物;(2)在系统发育确认后以确保纤毛虫拷贝的单系性(Fig. 1)。所有系统发育确认的LGT候选基因还使用ExPASy筛查了框内终止密码子(UGA、UAA和UAG)。在纤毛虫/Euplotes特定的遗传密码下(表6、10),这些密码子编码氨基酸而不是终止信号;因此它们在开放阅读框中的存在证实了这些序列代表真正的纤毛虫转录本,而不是原核污染。最后,为了排除由错配的非同源区域产生的树形伪影,我们计算了M. yantaiensis蛋白质与其在ML树中形成的姐妹原核支系之间的蛋白质同源性衍生功能相似性(HFSP)得分(Fig. 1;Mahlich等人2018;Rost 2002)。只有HFSP得分≥5.0的候选基因被接受为真正的原核到纤毛虫的LGT(Alsmark等人2013)。
此外,对于七个关键的LGT候选基因(acs、arcC-OTC、lacZ、man_1、man_4、ME2和OTC),还通过对M. yantaiensis的单细胞基因组DNA进行聚合酶链反应(PCR)和Sanger测序来验证这些基因的存在(见上文;图1)。
为了将LGTs与M. yantaiensis相关的细菌进行比较,我们对3个纤毛虫细胞的基因组DNA进行了单细胞Pac-Bio测序。使用PacBIo II HiFi Circular Consensus Sequencing(CCS)技术扩增并测序了几乎完整的16S rRNA基因。16S rRNA基因的扩增、测序和数据处理方法在补充文本中详细说明。
在过滤掉低质量和短读长(<200 bp)后,C1和C2分别保留了14,095,201个(4.23 Gb)和16,819,304个(5.05 Gb)读长。使用Trinity软件进行组装后,C1得到了26,038个contigs,C2得到了29,484个contigs(补充表S5)。这两个单细胞转录组(SCTs)显示出较低的测序偏差(补充图S1A),并且具有高重复性,基因长度和GC含量分布相似(补充图S1B、C)。它们共享了76%的contigs(补充图S1D),成功注释的转录本在物种分类(补充图S2A)和功能分类(基因本体和KEGG分配)方面表现出高度一致性(补充图S2B、C;表S7)。两个SCTs都表现出高完整性和低污染水平(补充表S6)。SCTs相对于aa-tRNA合成酶数据集的基因回收率为100%,相对于248个核心真核基因集为87%和88%,相对于BUSCO Alveolata核心基因为79%和71%,相对于Nyctotherus ovalis注释的蛋白质为90%(补充表S6)。总体而言,我们认为这两个细胞的数据可以代表该物种转录组的主要特征。关于GC含量、contig长度、污染水平和完整性的详细信息在补充文本、表S5-S7以及补充图S1、S2中提供。
共鉴定出63个M. yantaiensis的高置信度原核来源的LGT候选基因(表1;图2)。其中,62个基因在系统发育树中与原核/病毒序列形成了稳健的支系,或者主要由原核/病毒和APM支系组成(图2;补充表S4;附加数据)。剩余的基因(lip)与原核序列有高置信度的BLASTp和HFSP匹配,但缺乏足够的同源物(<20个)进行系统发育分析。所有63个LGT基因在M. yantaiensis中都有显著表达(8–1232 FPKM;图1),并且七个关键的LGT候选基因(acs、arcC-OTC、lacZ、man_1、man_4、ME2和OTC)在M. yantaiensis的单细胞基因组中成功扩增(登录号:OR730783–OR730792;补充表S4)。所有63个基因在≥2个APM物种中都有同源物,而15个基因在APM支系外的纤毛虫中也有保守(图2)。大多数基因在M. yantaiensis的转录本或同源APM转录本/基因组支架中表现出明显的真核特征:56个基因含有poly(A)尾,60个基因两侧有纤毛虫/真核基因或含有内含子(图2;补充图S3,表S4)。此外,52个基因在其对应的转录本中包含纤毛虫或Euplotes特有的框内终止密码子(UGA/UAA/UAG)(图2;补充表S4)。所有基因与树中原核姐妹群的HFSP相似性都很高(≥5)(附加数据)。这些证据排除了上述LGT基因是随机测序伪影、细菌污染或同源性错误分配的可能性。
表1 列出了在Metopus yantaiensis和其他APM纤毛虫中鉴定出的横向转移基因(LGT)候选基因的酶名称和缩写。括号中的数字表示同一基因发现的拷贝数。
图2 这张图片的替代文本可能是使用AI生成的。
图2的完整图像
Metopus yantaiensis中横向转移基因(LGT)候选基因的功能注释、基因特征及其在Armophorea-Muranotrichea-Parablepharismea(APM)组和其他纤毛虫类中的分布。仅绘制了与M. yantaiensis LGT具有单一原核起源的纤毛虫同源物。MY:Metopus yantaiensis。基因缩写在表1中定义。表达量(FPKM)是指在两个MY单细胞转录组中观察到的较高值。括号中的数字表示多拷贝基因,其FPKM是所有拷贝的总和。
功能注释概述
鉴定出的63个LGT基因可以分为以下功能类别:复杂碳水化合物降解(19个基因)、蛋白质/核苷酸水解和回收(8个基因)、碳/能量代谢(8个基因/结构域)、氮/氨基酸代谢(9个基因)、磷酸盐/硫代谢、脂质代谢、膜稳定性和解毒/氧化应激反应(19个基因)(表1)。其中,四个基因/结构域(grxD、纤毛虫FeFe氢化酶结构域HoxU和HoxF以及sad)被预测定位在氢体中(补充表S8)。其他LGT候选基因被认为编码细胞质蛋白,因为它们缺乏线粒体和氢体的氨基酸信号。下面列出了在原生生物甚至整个真核谱系中值得关注的基因。
与复杂碳水化合物分解和蛋白质/核苷酸回收相关的基因
共有27个原核LGT基因被预测参与复杂碳水化合物(多糖和氨基酸糖)的降解以及蛋白质/核苷酸的回收,其中25个基因在三个以上的APM物种中广泛存在(表1;图2)。其中,十个基因(man_1–4、MANEA、lacZ、bgaB、malQ、abnA和GAM)编码参与多糖降解的糖苷水解酶,包括半纤维素(甘露聚糖)、淀粉和其他糖类(表1;补充图S4)。七个LGT候选基因(pbp4b、NamZ、anmK、NAGLU、nagB-PIGL、murQ和RENBP)被预测参与氨基酸糖的降解(表1;补充图S5、S6)。特别是,六个基因显示了同工酶(man_1–4、lacZ和bgaB),而四个基因有多个拷贝(man_1、man_2、pbp4b和nagB-PIGL)(表1;图2)。此外,鉴定出的LGT基因还包括三个蛋白酶(iaaA、ACE和pepN)和五个核酸/核糖代谢基因(ushA、YjgF、内切酶、ade和punA)(表1)。
与碳和能量代谢相关的新型基因
八个横向获得的基因/结构域(acs、ME2、glk、pfk、ppdK、sad、HoxU和HoxF)被预测参与碳和能量代谢(表1;图2)。其中,两个基因——acs和ME2——是真核生物中的新获得基因。据我们所知,这是首次报道这种类型的原核AMP形成ACS基因(EC 6.2.1.1)在真核生物中的转移(尽管已有报道编码其他远缘同源ADP形成ACS酶的基因转移到其他厌氧真核生物中,参见Jerlstr?m-Hultqvist等人2013;Leger等人2017;Sánchez等人2000)。ME2的转移仅在寄生虫Trichomonas和Entamoeba中记录到(Dole?al等人2004;Field等人2000)。系统发育分析揭示了这两个基因向APM组的不同进化轨迹(图3、4)。APM acs基因(以下简称apm-acs)与经典的真核乙酰辅酶A合成酶不同,它从一个新的原核支系转移而来(完全支持;图3),该支系主要由环境来源的古菌谱系(例如,Bathyarchaeota、Pacearchaeota、Odinarchaeota、Hadesarchaea和MSBL1)和CPR类群(例如,Parcubacteria、Nealsonbacteria和Wildermuthbacteria)组成。APM ME2基因(以下简称apm-ME2)形成了一个与其他真核生物(例如,Trichomonas、Entamoeba和其他纤毛虫)不同的支系,并从一个新分类的古菌谱系转移而来(完全超快自举支持;图4)。另一个LGT——ppdK基因特别值得注意,因为它在M. yantaiensis和特定的APM类群中保持了五个同源拷贝(图5)。APM ppdK基因的起源与其他真核生物不同,它从一个新的原核支系转移而来,该支系主要由环境来源的古菌门类(例如,Ca. Woesearchaeota、Ca. Aenigmarchaeota和Ca. Nanoarchaeia)和细菌MAGs组成(完全支持;图5)。
图3 这张图片的替代文本可能是使用AI生成的。
基于LG+C60+C60+F+I+R9模型,并根据477个氨基酸构建的,专门检测APM组中编码AMP形成乙酰辅酶A合成酶(acs)的基因的最大似然系统发育树,以及相应的基因组支架图示。括号中的数字表示合并的同源物;关键的SH-aLRT/超快自举支持值显示在图中。节点上的实心圆表示SH-aLRT>95%和超快BS≥95%的分支。完整的蛋白质树在在线附加数据中。APM物种后的后缀“T”、“G”和“Amplified”分别表示转录本、基因组和PCR扩增序列。在支架草图中,预测的基因用颜色编码;粗线表示内含子。基因上方的字母“C”、“E”、“B”和“N”分别表示属于纤毛虫、真核生物、细菌以及没有显著NCBI nr同源物。
图4 这张图片的替代文本可能是使用AI生成的。
基于357个氨基酸,并根据LG+C60+I+R8模型构建的,专门检测编码小苹果酸酶(ME2)的基因的最大似然系统发育树,以及相应的基因组支架图示。最大似然拓扑结构包括关键的SH-aLRT自举支持值,随后是UltraFast自举支持值。图3中的图例适用于图5。此图像的替代文本可能是使用AI生成的。全尺寸图像。
基于703个氨基酸的丙酮酸磷酸二激酶(apm-ppdK)的最大似然系统发育树,是在LG + C20 + F + I + R10模型下构建的,并展示了相应的基因组支架。最大似然拓扑结构包括关键的SH-aLRT自举支持值,随后是UltraFast自举支持值。图3中的图例适用于图5。
与氮代谢相关的新基因
在鉴定出的LGT基因中,有9个与氮代谢(amt、arcC-OTC、arcC、OTC和hcp)和氨基酸降解(lysA、HAL、OCD和pydC)有关(表1;图2)。其中,arcC-OTC基因由一个氨基甲酸酶(arcC;EC: 2.7.2.2)结构域和一个鸟氨酸氨基甲酰转移酶(OTC;EC: 2.1.3.3)结构域组成,在整个生命域中都非常罕见(图6C)。在NCBI nr数据库中不存在显著相似的序列,类似的基因排列仅在一些肠杆菌和γ-变形菌中找到,即arcC和argF(OTC的同工酶;图6C)。值得注意的是,在M. yantaiensis或其他APM成员的LGT基因中同时鉴定出了独立的OTC和arcC基因(图2)。对arcC和OTC片段进行了系统发育分析,以追踪这种arcC-OTC融合基因的进化起源(图6A,B)。结果表明,融合基因中arcC和OTC片段的最近邻居并不相同:APM的arcC起源于Cloacimonetes细菌(图6A;完全支持),而OTC则与一个大的变形菌支系聚类(图6B;完全支持)。这两个基因都与已知的真核生物arcC和OTC基因无关,也与肠杆菌和γ-变形菌操纵子中的arcC/argF基因无关(图6A,B)。
图6
此图像的替代文本可能是使用AI生成的。全尺寸图像。
A、B 编码氨基甲酸酶(arcC)和鸟氨酸氨基甲酰转移酶(OTC)的基因的最大似然系统发育树,显示了APM纤毛虫中融合/未融合的arcC和OTC的系统发育位置,以及相应的基因组支架。arcC系统发育树(215个氨基酸)是在LG + C60 + R8模型下构建的,OTC系统发育树(222个氨基酸)是在LG + C60 + I + R9模型下构建的;显示了关键的SH-aLRT/UltraFast自举支持值。除非另有说明,否则使用图3中的图例。APM物种后的紫色星号表示来自融合基因的区域。细菌支系后的红色星号表示已知的细菌arcC和argF(OTC)操纵子的位置。图(B)中的箭头指示了Cloacimonetes属的位置。C 绘制了独立的和融合的APM arcC和OTC LGT基因的草图,以及来自肠杆菌属(NCBI登录号CP077290.1)和Salinivirga cyanobacteriivorans(NCBI登录号CP013118.1)的已知arc操纵子;箭头表示假定的开放阅读框(ORFs);线条表示非编码区域;虚线表示arcA和arcC之间的其他操纵子的存在。细菌操纵子中的缩写:arcA,编码精氨酸脱亚胺酶的基因;arcC,编码氨基甲酸酶的基因;arcF,编码鸟氨酸转氨基甲酰酶的基因。
参与其他途径的基因
在M. yantaiensis和APM组中,有两个LGT基因(dcyD和PLD1_2)分别参与硫和磷的代谢(表1;图2)。我们还鉴定了17个与多种细胞过程相关的LGT基因,包括:(i)脂质代谢和膜稳定(lip、STC和pmtA);(ii)信号转导和RNA修复(TMEM97和Rnl2);(iii)氧化还原平衡和氧化应激反应(MsrA、NQO1_1–3、NQO2、氧化还原酶、GLO1、grxD、crtI和crtISO);以及(iv)重金属解毒(AS3MA和cutC)(表1;图2)。值得注意的是,这些基因中的大部分(特别是与脂质代谢和重金属抗性相关的基因)似乎不存在于肠道共生体Nyctotherus ovalis中(图2)。
APM纤毛虫LGT的原核供体
系统发育分析和BLASTp结果显示,63个LGT候选基因具有原核/病毒起源:33个来自常见细菌,1个来自病毒,27个来自新分类的细菌/古菌分类群的宏基因组(MAGs),这些分类群是从环境序列中衍生出来的(图2;补充表S4;额外数据)。值得注意的是,这些MAGs主要与候选门辐射(CPR)原核生物和其他最近鉴定的“微生物暗物质”群体相关——主要是通过分子数据识别出的未培养的微生物谱系(例如,图3-6;补充图S8,S9)(Brown等人2015;Rinke等人2013)。APM LGT的候选供体在分类学上与在M. yantaiensis单细胞中检测到的主要相关细菌(Sphingomonas、Streptococcus)不同(补充图S7;表S9;Omar等人2017),并且与360个潜在的污染物原核mRNA序列没有属级别的关联(补充图S7)。这表明LGT供体不太可能是M. yantaiensis的当前内共生体,而是祖先共生体的遗迹(Husnik和McCutcheon 2016)或过去的原核猎物(Keeling 2024)。
讨论
通过严格的系统发育和多方面的基因组分析,我们在APM纤毛虫中鉴定了63个来自原核生物/病毒的横向转移基因(LGTs),其中一些基因及其进化轨迹在真核生物中是罕见的。如果这些LGTs在功能上是固定的,它们可能会为恶劣环境或碎屑生态系统提供重要的适应优势。通过异源蛋白表达、基因编辑或RNA干扰(RNAi)对LGTs的功能验证仅限于选定的模式真核生物,例如卵菌和昆虫(Attah等人2024;Fang和Tyler 2016;Zhang等人2025a)。对于Metopus yantaiensis和大多数APM分类群,无法建立无菌培养——这排除了通过这些方法验证此处鉴定的LGTs的可能性,因此留下了它们可能是沉默的或假基因的状态。然而,它们在M. yantaiensis和其他APM的转录组中的高表达,跨APM谱系的保守性,以及存在多个拷贝(2-5个)(图2;表1)强烈表明这些LGTs在APM纤毛虫中可能是功能性的(或曾经是功能性的)。因此,在假设它们具有功能性的前提下,我们推断这些LGTs可能对APM纤毛虫具有潜在的生理和生态作用(图7,8),旨在为未来的功能验证(随着技术能力的进步)和生态模型的完善提供框架。
图7
此图像的替代文本可能是使用AI生成的。全尺寸图像。
预测的细胞过程包括在Metopus yantaiensis细胞中受横向基因转移(LGT)影响的复杂碳酸盐降解(A)和碳及能量代谢(B)。细胞膜和内部细胞器用实线勾勒,不同的途径用颜色块表示。酶名称位于箭头旁边。红色箭头表示LGT来源的基因,而黑色箭头表示祖先继承的直系同源基因。虚线箭头表示多步骤反应或过程。LGT来源基因的完整名称列在表1中。代谢物缩写的完整名称和额外酶:AnhMurNAc,无水-N-乙酰胞壁酸;GlcNAc,N-乙酰葡萄糖胺;ManNac,N-乙酰甘露胺;HydA:氢化酶A;MDH,苹果酸脱氢酶。
图8
此图像的替代文本可能是使用AI生成的。全尺寸图像。
预测的细胞过程包括在Metopus yantaiensis细胞中受横向基因转移(LGT)影响的氮、硫和磷酸盐代谢(A),以及LGT对解毒和脱氧的贡献(B)。细胞膜用实线勾勒,不同的途径用颜色块表示。来自LGT的酶用红色标记。虚线箭头表示多步骤反应或过程。LGT来源基因的完整名称列在表1中。代谢物缩写的完整名称和额外酶:L-DAL,L-2,4-二氨基丁酸;PC,磷脂酰胆碱;SAH,S-腺苷同型半胱氨酸;SAM,S-腺苷甲硫氨酸。
自由生活厌氧纤毛虫中复杂有机物降解基因转移的潜在意义
在63个横向转移基因中,有19个参与多糖(半纤维素和其他糖类)和氨基糖的降解(表1);它们的高多样性和完整性在报道的原生动物LGT中很少见(图7A)。其中一些基因具有同工酶(例如,man_1–4、lacZ和bgaB)和多个拷贝数(例如,man_1、man_2、pbp4b和nagB-PIGL)(表1;图2),这表明它们潜在功能的重要性。
此前,纤维素/半纤维素LGT主要在瘤胃纤毛虫/腐生原生动物中报道(Ricard等人2006;Savory等人2015),在自由生活的食细菌生物中也有零星出现(例如,Mastigamoeba和Pelomyxa)(Treitli等人2023;Verner等人2021);这些受体谱系中的几个通常具有原核共生体,表明共生是这些LGT的重要来源。对于APM分类群,上述基因可能扩展了在土壤/沉积物中可以利用的碳水化合物范围(图7A),如在瘤胃纤毛虫中报道的(Ricard等人2006)。这些多糖降解酶可能使纤毛虫能够分解植物残渣和藻类细胞壁中的多糖(图7A)。氨基糖是肽聚糖的主要成分,APM分类群获得的氨基糖降解酶(例如,NamZ、nagB-PIG-L和murQ)构成了完整的肽聚糖降解途径(图7A)。获得这些酶可能使APM分类群能够分解土壤和沉积物中的生物残渣,如细菌细胞壁和真菌细胞壁(Joergensen 2018;Konopka 2012)。氨基糖降解LGT仅在原生动物中偶尔被报道,主要在寄生虫中,它们有助于宿主入侵或破坏表面葡糖胺抗原(Alsmark等人2013;Andersson 2006;Eme等人2017)。最有趣的是,参与糖类感知和处理的基因在纤毛虫Paramecium bursaria中被发现与藻类共生体有关;与我们的纤毛虫数据一样,这些包括几个来自细菌的横向转移基因,包括NamZ和几个β-甘露糖苷酶(Jenkins等人2024)。我们对一个氨基糖降解基因RENBP的系统发育分析表明,该基因在APM纤毛虫中的起源是细菌共生体(补充图S6),这表明宿主-共生体相互作用也可能是在这个谱系中获取这一途径的初始选择压力。
最后,鉴定的LGT基因包括三种蛋白酶(iaaA、ACE和pepN)和五种核酸/核糖代谢基因(ushA、YjgF、内切酶、ade、punA)(表1;图7A)。这些基因主要参与蛋白质分解或核酸/核糖的回收——回收DNA/RNA/核糖成分用于核苷酸、磷酸和糖的循环利用(图7A)。与多糖/氨基糖降解LGT协同作用,这些元素可能共同增强氮、碳和核苷酸代谢的可用性(图7A)。
在APM分类群中新鉴定的63个横向基因转移中,我们揭示了几种在真核生物中的新LGT事件。值得注意的是,两个与碳代谢相关的基因(apm-acs和apm-ME2)在真核生物中很少见,而apm-ppdK基因则不同,因为它在APM分类群中有五个拷贝。从功能上看,这些新基因可能参与碳代谢产物的循环利用和能量生产效率的提高(图7B)。
acs和ME2编码的酶可以利用苹果酸、乙酸来产生脂质生物合成所需的关键底物(乙酰辅酶A和NADPH)(Dole?al等人2004;Starai和Escalante-Semerena 2004;Stegink和Coon 1968)。苹果酸和乙酸是厌氧纤毛虫糖酵解和发酵的中间产物,通常被排泄出来供环境中的原核生物利用(Müller等人2012)。在M. yantaiensis和其他APM成员中,这些纤毛虫可能从原核生物那里获得了这些基因,以循环利用厌氧呼吸的代谢产物(图7B)。这种机制可以减少碳源的损失和对外部碳源的需求。类似的机制也在Trichomonas vaginalis中报道过,它获得了细胞质中的ME2基因以利用苹果酸并产生额外的NADPH用于生物合成(Dole?al等人2004)。
此外,与碳代谢相关的apm-ppdK基因有五个拷贝(图5),表明它具有导入功能。连同另一个基因PFK,这些基因的获得也在其他厌氧原生动物(氧单胞体和副细菌)中被报道,以提高糖酵解期间的ATP生成效率,补偿厌氧代谢中固有的低代谢产量(Slamovits和Keeling 2006)。这种机制也可能适用于厌氧APM纤毛虫(图7B)。
APM纤毛虫中鉴定的氮代谢相关融合基因arcC-OTC没有在整个生命域中找到同源序列。从功能上看,这个罕见基因可能参与厌氧纤毛虫对无机氮源的利用(图8A)。融合的arcC-OTC基因结构表明它参与了双重功能的代谢途径。其中一条代谢途径是精氨酸脱亚胺酶途径(ADH)——这是一种产生能量的途径(Biagini等人,2003年;Linstead和Cranshaw,1983年;Schofield等人,1992年),但由于APM纤毛虫的基因组数据中缺乏编码精氨酸脱亚胺酶(arcA/ADI)的关键基因、基因顺序的反转(arcF/OTC位于arcC上游;图6C)以及系统发育学上的分歧(图6A、B),因此被排除在外。相反,研究发现其与硅藻的鸟氨酸-尿素循环(OUC)有相似之处(Allen等人,2011年;Armbrust等人,2004年)。在硅藻的OUC中,源自LGT的arcC和OTC(上游排列)利用氨氮和碳酸盐合成氨基甲酰磷酸,这是合成含氮化合物的关键底物(Allen等人,2011年;图7A)。其他源自原核生物的氮代谢LGT(如OCD和hcp)也在APM纤毛虫和硅藻中被发现(Allen等人,2011年;Armbrust等人,2004年)。在这种情况下,APM的arcC-OTC融合以及其他LGT(如OCD、hcp)可能反映了这种类似OUC的功能,有助于无机氮的吸收和碳-氮的平衡(Allen等人,2011年)(图8A)。这些发现强调了源自原核生物的氮代谢在不同真核生物谱系中的趋同进化。
除了arcC-OTC之外,APM纤毛虫中还发现了其他五个参与氮代谢和氨基酸代谢的LGT基因(表1;图8A)。这些基因的功能可以根据现有信息进行预测:1)氨的吸收(amt)(Soupene等人,2002年);2)必需氨基酸的生物合成(lysA)(Stragier等人,1983年);3)复杂酰胺与氨、CO?或碳骨架之间的转化(HAL);4)合成对蛋白质合成、生物能量代谢和抗逆性至关重要的复杂氨基酸和多肽(如脯氨酸和精胺)(OCD)(Christgen和Becker,2019年);5)抵抗一氧化氮并调节发酵和氮利用途径(hcp)(Wang等人,2016年)。如果这些基因在APM群体中具有功能,它们可能通过多样化的氨基酸代谢途径帮助纤毛虫适应氮源缺乏或其他环境压力(图8A)。
除了上述代谢途径外,APM纤毛虫中发现的LGT基因还包括两个参与磷酸盐和硫代谢的基因(表1;图8A)。已知的功能包括:利用含有D-硫的氨基酸而非L-氨基酸(dcyD)(Soutourina等人,2001年);分解磷脂以回收磷酸基团,这支持细胞增殖、细胞骨架重塑和抗逆性(PLD1_2)(Christeller和Tolbert,1978年;Jenkins和Frohman,2005年)。此外,还有19个基因/结构域可能参与适应过程(图8B):脂质分解和利用(lip和STC)、膜稳定性(pmtA)、信号转导(pmtA)以及应激下的rRNA修复(Rnl2)(Banta等人,2015年;Bexkens等人,2018年;Salsabila和Kim,2024年;Shen等人,2021年)、耐氧性(HoxU、HoxF、MsrA、NQO1_1-3、NQO2、氧化还原酶、GLO1、grxD和crtISO)(de Koning等人,2000年;Dobri等人,2014年;Rotterová等人,2020年)以及重金属抗性(AS3MA和cutC)(Chen等人,2017年;Ge等人,2022年)。结合上述新基因,这些基因可能使APM纤毛虫群体获得适应恶劣厌氧土壤和沉积环境的新功能,例如营养缺乏、重金属压力和氧气波动(图7、8)。值得注意的是,大多数这些基因——特别是那些参与脂质代谢和重金属抗性的基因——在肠道共生体Nyctotherus ovalis中不存在(图2)。这可能反映了N. ovalis由于肠道环境中氧气和重金属暴露减少而导致的二次基因丢失。
本研究首次系统地分析了自由生活的纤毛虫中的LGT,因为之前的研究主要集中在瘤胃和寄生谱系上(Ricard等人,2006年;Xiong等人,2015年)。比较分析揭示了不同的生态模式:瘤胃纤毛虫获得了类似于我们自由生活的APM物种的复杂碳水化合物代谢基因(Ricard等人,2006年),而鱼寄生纤毛虫则主要拥有与血红素利用、信号传导和附着相关的LGT——这些功能与宿主入侵和利用有关(Xiong等人,2015年)。总体而言,这些发现表明,自由生活和共生纤毛虫中的LGT库主要反映了环境中的营养可用性和代谢压力,而寄生谱系则表现出明显的宿主适应特征。然而,鉴于目前对纤毛虫和微生物真核生物LGT的采样有限,这些模式仍处于初步阶段。未来需要在不同的真核生物谱系、生态背景和共生状态下进行比较分析,以确立LGT进化的普遍规律。
我们的分析首次提供了证据,证明原生生物可以从候选门辐射(CPR)原核生物和其他最近发现的“微生物暗物质”群体(图2;补充表S4)中获取基因——这些主要是通过分子数据知晓的未培养微生物谱系(Brown等人,2015年;Liu等人,2022年;Murugkar等人,2020年;Rinke等人,2013年)。这些基因为APM纤毛虫提供了多种潜在功能:复杂碳水化合物的降解(anmK、nagB-PIGL、murQ、RENBP、iaaA、ushA、YjgF、内切酶)、乙酸/苹果酸的保留和能量效率的提高(apm-acs、ME2和apm-ppdK)、氨的吸收和氨基酸代谢(arcC、OCD)以及抗逆性和耐氧性(STC、lip、氧化还原酶、HoxU)(图3–6;补充图S8、S9)。基因组和宏基因组分析表明,许多“微生物暗物质”群体,包括CPR细菌,缺乏完整的柠檬酸循环或呼吸链,这与它们适应低氧环境的能力一致(Brown等人,2015年;Rinke等人,2013年)。此外,许多CPR成员被认为是多种生物的共生体,包括纤毛虫(Brown等人,2015年;Gong等人,2014年;Nelson和Stegen,2015年)。这表明未培养的CPR细菌可能与自由生活的厌氧原生生物形成了关联,使宿主能够通过LGT获得新的碳源并适应缺氧的土壤环境。因此,CPR向纤毛虫的基因转移代表了一种以前未被认识到的机制,使原生生物能够在厌氧栖息地中扩展代谢能力和生态位。
结论
原生生物与原核生物之间的共生和捕食相互作用在各种自然生态系统中普遍存在。虽然人们已经广泛关注环境原核生物的代谢潜力,但最近的研究开始揭示这些关联可能对自由生活原生生物的基因组变化及其代谢和生态潜力的影响。通过对自由生活的非模式APM纤毛虫表达基因的首次调查,我们发现这些单细胞真核生物中的许多基因可能是通过侧向基因转移(LGT)从原核生物那里获得的。这些LGT基因预计参与有机物的利用(半纤维素和氨基糖)、中间代谢物的回收(苹果酸、乙酸)、无机营养物质的合成(例如氮)以及对抗恶劣环境的耐受性(例如氧化、有毒和营养缺乏)。未来的研究需要采用基因编辑(或RNAi)和产物同位素标记等技术来验证这些基因在纤毛虫中的功能。如果这些基因被证明具有功能,它们将在APM纤毛虫适应土壤/沉积环境的生活方式中发挥重要作用。鉴于自由生活原生生物的高度多样性和丰富性以及它们与细菌和古菌的广泛相互作用,原生生物可能拥有丰富的源自原核生物的基因库。这一发现意味着原生生物可能是之前主要归因于原核生物和真菌的生物地球化学活动的被低估的贡献者。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号