
-
生物通官微
陪你抓住生命科技
跳动的脉搏
噬菌体Cp1R7A-A1感染日本中慢生根瘤菌的转录组学解析及其tRNA依赖性生存策略研究
【字体: 大 中 小 】 时间:2025年09月23日 来源:Canadian Journal of Microbiology 1.6
编辑推荐:
本研究通过RNA-Seq技术揭示了噬菌体Cp1R7A-A1感染日本中慢生根瘤菌过程中的全基因组转录动态,发现全部237个预测基因(含27个tRNA基因)均表达,并首次报道其tRNA依赖的生存策略。宿主营养摄取和能量代谢基因早期显著上调,3小时后肽聚糖水解酶表达升高,为理解噬菌体-宿主互作提供了关键转录组学基础。
引言
噬菌体能够重编程或抑制宿主转录机制,深刻改变宿主细胞进程。RNA-Seq技术已成为研究噬菌体转录模式和宿主应答的强大工具,为感染期间的基因表达模式提供关键见解。比较转录组学分析有助于理解相关噬菌体的保守功能策略(如感染、转录启动等),同时RNAseq数据可优化噬菌体基因组注释,通过验证推定基因的实际表达情况及表达时序,为选择高表达假设蛋白进行功能研究提供依据。
Cp1R7A-A1(vB_MloS_Cp1R7A-A1)是感染日本中慢生根瘤菌R7A(GenBank accession: CP033366.1)的噬菌体,该宿主是豆科植物重要共生固氮细菌。该噬菌体具有突伸衣壳和较大基因组(131 434 bp),与数据库中其他中慢生根瘤菌噬菌体相比展现出独特基因组特征。其237个预测基因中仅57个具有功能注释(含tRNA基因),功能明确的蛋白编码基因包括提示类似复制机制的T7样DNA聚合酶,但不同于T7的是Cp1R7A-A1缺乏注释的RNA聚合酶。27个预测tRNA基因主要聚集在基因组一个区域。RNAseq研究可提供初步但关键的信息,揭示此类噬菌体中假设蛋白和tRNA基因在生命周期中是否表达,从而支持后续功能研究以全面解析噬菌体基因组。此外,感染过程中宿主转录组随时间的变化可为噬菌体-宿主感染动态提供宝贵信息。
方法论
噬菌体感染与RNA提取
日本中慢生根瘤菌R7A在30°C TY肉汤中生长24–48小时达到约1 × 109 CFU/mL(0.2 OD600),用Cp1R7A-A1噬菌体裂解液(1 × 1011 PFU/mL)以感染复数(MOI)100进行感染。选择高MOI是为同步化感染并确保强可检测的噬菌体基因转录信号,因为Cp1R7A-A1是慢生长噬菌体(需72小时30°C孵育才能在琼脂双层上产生斑块),且高MOI感染宿主时产生更高噬菌体滴度(~1011 PFU/mL)。感染宿主培养物充分混合后分装为2 mL等份,在30°C旋转培养箱中孵育。每小时取两份等份(技术重复)作为样本,共3小时,立即-80°C冷冻。
使用GE Healthcare illustra? RNAspin Mini Isolation Kit按制造商说明提取RNA。未感染细菌培养物(宿主培养物与等体积TY培养基混合代替噬菌体裂解液)的RNA提取物作为对照。冷冻样本在冰上解冻后立即用RNA提取kit中的裂解缓冲液处理,迅速破碎细胞并通过终止基因表达保持天然转录谱。
未感染宿主对照以及感染1、2、3小时后的RNA提取物进行RNA测序处理,从DNA去除到下游分析。因预实验观察到噬菌体慢生长特性,选择1小时间隔长孵育时间。首先用Turbo DNA-free kit进行DNase处理以去除残留基因组DNA(gDNA),遵循 rigorous DNase treatment方案(Thermo-Fisher)。随后用Qubit荧光定量(Qubit RNA HS assay kit和dsDNA HS assay kit,Invitrogen)测量各样本的RNA和DNA浓度。总RNA质量用Bioanalyzer RNA Nano chip(Agilent)评估。用16S rRNA引物进行qPCR assay以确认gDNA完全去除。用Illumina Ribo-Zero plus rRNA depletion kit去除rRNA,保留样本中mRNA和其他小RNA。再次测定rRNA去除后RNA制备物的量和质。库制备前样本-80°C储存。
使用NEBNext Ultra II RNA library Prep Kit for Illumina(New England Biolabs)、Q5 high fidelity DNA polymerase(NEB)和Illumina index primers,按制造商说明进行RNA片段化、第一和第二链cDNA合成、接头连接、条形码标记和PCR扩增以制备RNA库。用Qubit DNA HS assay kit(Invitrogen)和Agilent DNA 2000 Nano kit测定库浓度和质量。初始可见的适配体二聚体通过额外 bead clean-up 去除。随后库在Illumina MiniSeq平台上用 single read MiniSeq High Output Reagent Kit(Illumina)测序。
Illumina生成的fastq reads用FastQC进行质量评估,Phred质量分数低于20的reads用Trimmomatic v0.39去除。修剪后的reads用FastQC重新分析。fastq读段文件用Bowtie2映射到噬菌体Cp1R7A-A1(MT188704.1)和宿主日本中慢生根瘤菌R7A(CP033366.1)的参考基因组(*.gb文件)。映射的reads用Geneious 11.1.5量化蛋白编码基因(CDS)和tRNA的表达。转录本标准化并量化为TPM/每百万转录本(映射到特定CDS/tRNA的RNA读段数每1000000 RNA读段)。各条件各重复的表达数据集进行Shapiro–Wilk检验以确定数据分布非正态,需非参数统计分析。此外,用Mann–Whitney U检验和Benjamini–Hochberg多重校正法(错误发现率FDR)确定重复间和条件间数据分布是否一致。统计分析用自定义Python脚本进行。
用Geneious 11.1.5进行配对差异表达分析,使用Geneious特定算法和默认参数。宿主基因差异分析中,各孵育时间点(1、2、3小时)与未感染对照比较。分析噬菌体基因差异表达时,2和3小时孵育样本与1小时孵育样本比较(对照无噬菌体核酸)。选择差异表达p值小于设定显著性值(0.05)且差异表达log2 ≥ 1(高表达基因)或log2 ratio ≤ -1(低表达基因)的基因用于热图生成和进一步解释。
结果与讨论
本RNAseq分析主要目的是表征噬菌体转录模式及噬菌体感染对宿主基因转录的影响。Cp1R7A-A1的RNAseq数据揭示了噬菌体基因组全部237个推定基因的表达,包括27个tRNA基因和210个蛋白编码基因(CDS)。映射到噬菌体基因组的测序读段比例增加表明噬菌体基因组转录增加。1小时孵育后仅约9%总测序读段映射到噬菌体基因组,但2和3小时后分别为38%和48%。同时映射到宿主基因组的读段从未感染对照的89%(11%未映射)降至感染1小时后的82%,2小时后进一步降至58%,3小时后降至48%。感染后1、2、3小时样本分别有9%、5%、12%未映射读段。低比例未映射读段可能因修剪后残留少量接头序列,这在RNA-seq实验中常见。映射到噬菌体和宿主基因组的读段百分比随时间变化表明噬菌体重编程宿主转录机制用于噬菌体基因转录。
Cp1R7A-A1噬菌体转录
各时间点(1、2、3小时)条件内重复数据集分布统计比较显示无显著差异,表明各条件内重复一致。但不同时间点间比较揭示随时间显著变化。1到2小时转变显著(校正p = 3.17 × 10?6),表明这些时间点间基因表达可测量转变。1和3小时间差异更显著(校正p = 1.29 × 10?8),突出感染进程强烈时间效应。相反,2对3小时比较不显著(p = 0.10),表明主要转录变化发生在感染后第1和第2小时间,2和3小时间差异较小。这些结果提示最显著基因表达转变发生在感染过程第1小时。
为深入理解各基因在这些噬菌体基因组转录变化中的作用,进行差异表达分析以检查各基因随时间转录模式。27个tRNA基因随时间的表达和差异表达如表2所示。噬菌体基因组存在tRNA基因主要由两种假说解释:若噬菌体与宿主间存在显著密码子使用偏好则补充tRNA,或作为抗防御机制抵消宿主对tRNA的耗竭。但该噬菌体与宿主有相似GC含量和密码子使用偏好。除全部27个噬菌体tRNA基因均表达外,我们还注意到不同孵育间隔存在差异表达而非恒定表达量。差异表达通过比较2或3小时后与1小时后基因表达确定。任何tRNA显著差异表达(差异表达p值 < 0.05)在表2中突出显示。负差异表达log2比率表示下调,正值表示某些tRNA基因表达上调。这些差异表达tRNA基因随时间的TPM值提示这些差异表达很可能是基因调控以维持感染宿主内恒定tRNA量的结果。已知细菌宿主表达多种tRNA核酸酶并在某些应激条件(如噬菌体感染)下激活它们。宿主细胞tRNA耗竭可能降低噬菌体增殖效率。因此,该噬菌体可能通过表达和适时调控噬菌体编码tRNA来抵消宿主细胞tRNA耗竭。
噬菌体全部210个CDS均显示转录,表明所有这些基因在噬菌体生命周期中可能发挥重要或有用的作用,无论当前预测功能如何。例如,含DUF3846结构域(预测具抗限制特性)的基因(Cp1R7A-A1_017)在转录研究中显示表达。其他研究提示该蛋白可触发某些宿主防御机制。所有CDS中,主要衣壳基因和其他结构蛋白编码基因观察到最高转录和随时间差异表达。某些功能未知的假设蛋白也位居列表前列。1、2、3小时孵育时间噬菌体基因表达热图如图1和图S1所示(为清晰和可读性,热图分为两图中四个面板)。
tRNA-Leub-00001,Cp1R7-A1基因组中一个亮氨酸tRNA基因(位点Cp1R7A-A1_092),显示极高表达如8–9 × 105 TPM。三个不同RNAseq读段组装覆盖图(所有三个孵育时间:1、2、3小时)显示该tRNA-Leub基因中心约800 bp区域高覆盖(表明高水平转录)。一种可能性是它包含噬菌体基因组复制起点,且因RNA引物存在高水平转录。人类细胞复制起始先前研究提示复制优先起始于具有高水平RNA聚合酶活性的基因转录起始位点。可能该噬菌体基因组复制也在高表达基因或高水平RNA聚合酶活性附近起始。可能计算出的tRNA-Leub表达极高是由于RNAseq读段映射tRNA和可能复制起点的RNA引物的累积映射, prior to expression calculation。噬菌体基因组210个CDS中,99个显示显著差异表达,≥2倍(log2 1)更高或更低表达 after 2 and 3 hours。这些99个基因可根据表达变异模式分为三组。Group-1含53个基因,1小时孵育表达最高但之后显著降低。Group-2含另34个基因,2小时后表达最高然后3小时降低。其他12个CDS在Group-3,显示表达随时间逐渐增加。
Group-1中多数CDS是假设蛋白,除HlfK/HlfC样蛋白酶活性调节因子(Cp1R7A-A1_075)、双功能(p)ppGpp合酶/水解酶(Cp1R7A-A1_118)、推定甲基转移酶(Cp1R7A-A1_145)、tRNA剪接连接酶(Cp1R7A-A1_134)和3 prime-5 prime核酸外切酶(Cp1R7A-A1_156)。Group-1基因很可能是早期表达基因, required in initial phage activities such as nucleotide metabolism, replication, DNA modification, regulation of transcription/replication/translation, and also importantly to neutralize the host defence, i.e., methyltransferase with anti-restriction activity, or tRNA splicing ligases to repair tRNA cleaved by the host to jeopardise the translation machinery to induce cell death as a defence strategy。像双功能(p)ppGpp合酶/水解酶的基因可抑制宿主生物膜形成。尽管不清楚对生物膜形成的影响是否与感染相关,但噬菌体可及性和对宿主的吸附可能受益于减少的生物膜形成。
除假设蛋白外,Groups 2 and 3基因多数由推定结构和裂解蛋白组成,分别代表中和晚期表达基因。值得注意的是,一个位点特异性整合酶基因(Cp1R7A-A1_140)显示表达2小时后显著增加。这可能表明一些噬菌体颗粒可能进入溶原循环。但整合酶表达下降而噬菌体结构和裂解基因感染后3小时高表达,提示该噬菌体可能主要具有裂解生命周期,尽管也存在溶原性。另一个显著事实是编码PhoH样磷酸盐饥饿诱导蛋白的基因在研究期间表达逐渐增加。通常Pho调节子基因使细胞能够有效利用有限磷酸盐资源或获取替代磷酸盐来源。因此,这可能是噬菌体在宿主细胞内产生更多子代时补偿有限资源的机制之一。
日本中慢生根瘤菌R7A宿主转录
各时间点(对照、1、2、3小时)条件内重复数据集分布统计比较显示无显著差异,表明各条件内重复一致。但条件间比较揭示随时间多次显著变化。所有感染后时间点与未感染对照比较均显著。有趣的是,1对2小时比较显示高度显著差异(校正p = 8.26 × 10?17),表明这些早期时间点间主要基因表达转变。但1对3小时比较不显著(p = 0.10),意味着这两个时间点基因表达相对相似。这些结果提示最戏剧性基因表达变化发生在感染后2小时左右,转录应答在1和3小时间稳定化。
通过比较各基因在1、2、3小时孵育与未感染对照中的表达,确定感染Cp1R7A-A1后日本中慢生根瘤菌R7A基因的差异表达。不同噬菌体-宿主组合研究中已显示宿主转录组偏差 due to phage infection。随着噬菌体接管宿主转录机制表达噬菌体基因,可预期宿主基因下调。但某些宿主基因可能因噬菌体感染显著上调。本研究中也观察到某些宿主基因感染后显著上调。
对上调宿主基因的仔细检查可能很重要,因为这些可能是宿主应答或防御噬菌体感染的地标,或宿主操纵用于噬菌体扩增。选择转录≥ log2 1(2倍)增加且p值≤ 0.05的基因用于进一步分析。根据选择标准,病毒感染1小时孵育后237个宿主基因表达显著增加。这些包括tRNA连接酶、50S/30S核糖体蛋白、某些RNA结合蛋白、DEAD盒RNA解旋酶、冷休克蛋白、参与能量代谢的蛋白(如NADH-醌氧化还原酶亚基、乙酰-CoA羧化酶生物素羧基载体蛋白)和某些其他代谢酶。2小时孵育后,284个宿主基因显示与未感染对照相比显著更高表达。2小时显著过表达基因列表包括转录调节因子(如RNA pol sigma-54/RpoN)、DNA转位酶、DEAD盒RNA解旋酶、50s核糖体蛋白、冷休克蛋白、某些用于能量代谢的酶和蛋白(如NAD合酶)和某些其他代谢酶。3小时孵育后,216个基因显著过转录,包括某些RNA聚合酶sigma因子、某些代谢酶和某些50S/30S核糖体蛋白。噬菌体感染后1–3小时这些宿主转录调节因子和翻译蛋白(如核糖体蛋白)的上调可能是由于噬菌体感染引发的细胞能量利用变化,以启动噬菌体基因表达和基因组复制。
显著差异表达且表达≥4倍增加且p < 0.05的最高上调宿主基因如图2所示。根据图2,某些ABC转运蛋白感染后孵育期间显著上调。ABC转运蛋白家族利用ATP结合和水解能量跨细胞膜转运各种底物或营养素。先前研究也显示噬菌体感染导致细菌宿主类似上调。ABC转运蛋白(如糖转运蛋白)表达增加可能是噬菌体子代生产和宿主防御机制进行时能量需求增加的结果。但我们在这些上调宿主基因中未观察到任何特别鉴定的防御相关宿主酶(如限制酶)。细菌中的冷休克蛋白是高度保守的核酸结合蛋白,在响应环境变化(特别是温度变化)中各种生理过程的转录调节中发挥作用。某些研究显示大肠杆菌感染P1vir噬菌体时冷休克蛋白显著下调,并假设这可能与P1vir接管宿主代谢的过程相关。相反,本研究显示日本中慢生根瘤菌冷休克蛋白感染后2小时显著上调。在日本中慢生根瘤菌中,这种上调可能只是细菌响应噬菌体感染后变化条件以求生存的应答。这显示了不同噬菌体-宿主组合间不同转录组动力学。
感染3小时后所选上调宿主基因的另一个显著观察是宿主裂解酶如裂解转糖基酶结构域包含蛋白、隔膜环裂解转糖基酶RlpA家族蛋白和裂解胞壁质转糖基酶的过表达。细菌转糖基酶是溶菌酶样酶,特异性利用肽聚糖作为底物并切割肽聚糖中某些糖苷键以创造空间用于某些细胞活动(如细胞分裂)。但这些酶的失调可能导致应激条件(如抗生素)下细菌细胞自我裂解或自溶。在此案例中,很可能是噬菌体感染引发的应激诱导自溶。
我们还分析了感染后宿主tRNA基因的表达模式,与观察到的噬菌体编码tRNA表达变化比较。虽然某些宿主tRNA基因显示恒定表达水平,但某些其他tRNA基因显示显著基因表达波动,如早期时间点显著上或下调随后后期恢复正常表达。尽管某些噬菌体tRNA基因也显示显著表达变异,但未建立所有案例中噬菌体和宿主tRNA表达波动间一对一相关性。
中慢生根瘤菌属是慢生长细菌,即使在指数期28–30°C也需约10小时增加OD600nm 0.1。因此,如已发表转录研究所示,这些物种在游离培养物短期孵育中未知发生剧烈转录变化,但在遭遇环境变化时(如从游离生活形式转变为共生形式)或应激条件时显著改变转录。我们的试验数据提供了证据,表明日本中慢生根瘤菌在活跃噬菌体感染期间短孵育期(3小时)发生显著转录变化。
总结而言,本研究提供了一个基础数据集,报告了噬菌体Cp1R7A-A1在日本中慢生根瘤菌中的转录动力学,突出感染期间噬菌体和宿主基因表达的显著转变。高表达tRNA基因的鉴定提示其在噬菌体生存策略中的潜在作用,而高表达编码假设噬菌体蛋白的基因为未来功能噬菌体基因组学研究提供候选基因,以深入理解噬菌体基因组景观中的新功能。某些宿主蛋白如ABC转运蛋白、代谢酶和宿主裂解酶的上调表明复杂相互作用,噬菌体可能利用宿主资源为自己谋利以及宿主对感染应激的应答。
尽管这些发现引人注目,但承认研究局限性很重要,包括短3小时孵育期和缺乏生物学重复。此外,本研究依赖先前发表转录组数据推断未感染日本中慢生根瘤菌在孵育期无显著转录变化。未来研究纳入多生物学重复、更短采样间隔(如每30分钟)、延长孵育时间、时间过程对照和补充方法(如蛋白质组学)对验证这些发现和加深理解噬菌体-宿主互作至关重要。
致谢
衷心感谢NSERC Discovery grants RGPIN-2015-03926和RGPIN-2020-04558对MFH的支持,以及RGPIN-2016-05670和RGPIN-2024-06141CKY的支持。KMDG感谢阿尔伯塔研究生卓越奖学金和Bettina Bahlsen纪念研究生奖学金的慷慨支持。
生物通微信公众号
知名企业招聘