编辑推荐:
铜绿假单胞菌(Pseudomonas aeruginosa)是一种常见的机会致病菌,严重威胁人类健康。本文通过分析 840 个全球分布的基因组序列,揭示了不同系统发育群在重组特征和辅助基因组结构上的差异,为防控其感染提供了重要依据。
引言
铜绿假单胞菌(Pseudomonas aeruginosa)属于革兰氏阴性菌,在 γ- 变形菌纲中广泛存在。它是一种代谢多样的微生物,能在水生、土壤、动植物等多种生态环境中生存 ,同时也是重要的机会致病菌,可引发多种危及生命的急性和慢性感染,像支气管扩张、呼吸机相关性肺炎、慢性阻塞性肺疾病、尿路感染等。在囊性纤维化(CF)成年患者中,约 60%-70% 会遭受其持续性感染,导致肺部功能下降,增加死亡风险。此外,它还是世界卫生组织认定的六大 ESKAPE 病原体之一,其中碳青霉烯耐药的铜绿假单胞菌在全球疾病负担中排名第四。
铜绿假单胞菌强大的环境适应能力和多样的表型,部分归因于其庞大的基因库。它的辅助基因组包含众多转运蛋白、分解代谢基因、转录调节因子和双组分调节系统等,这些基因有助于它抵御压力,即便反复接触抗菌药物也能存活。而且,噬菌体、质粒等多种可移动遗传元件在菌体内普遍存在,加速了辅助基因的水平转移。但菌株间在抗菌药物敏感性、流行潜力、毒力特征等方面存在显著差异,给治疗带来了巨大挑战。因此,本研究旨在剖析铜绿假单胞菌谱系的重组特征和辅助基因组结构,为防控其感染提供依据。
结果
- 两个主要系统发育群主导全球铜绿假单胞菌种群:研究人员从 35 个国家、六大洲收集了 840 个铜绿假单胞菌基因组序列,时间跨度从 1936 年到 2014 年,涵盖囊性纤维化患者、急性感染病例、非临床环境和动物等四个生态来源。通过分析,确定了该菌的泛基因组由 28,019 个基因组成,包括核心基因、软核心基因、壳基因和云基因 。
利用贝叶斯层次聚类分析核心基因组,发现铜绿假单胞菌可分为五个系统发育序列簇(即系统发育群 1 - 5),其中系统发育群 1(BAPS5)和 2(BAPS4)占主导,分别包含 616 个(占总数 73.33%)和 206 个(占总数 24.52%)基因组,在六大洲、四个生态来源和所有采样年份中均有分布。通过多位点序列分型(MLST)检测到 261 种已知序列类型(ST),7 种主要 ST(ST17、ST111、ST146、ST235、ST253、ST274 和 ST395)占数据集的 33.81%,且分布在两个主要系统发育群中 。
2. 核心基因组中同源重组频繁且特征多样:聚焦系统发育群 1 和 2,利用 Mcorr 软件计算六个重组参数发现,两个群在多样性(d)、突变分歧(θ)、重组分歧(?)、重组与突变相对速率(?/θ)、重组覆盖度(c)和重组事件中位片段大小(f?)上均存在显著差异。总体而言,虽然重组事件数量相对较少,但对基因组序列影响较大,且该研究结果与先前研究中临床铜绿假单胞菌种群的相关数据可比 。
运用 Gubbins 软件扫描窗口法,识别出两个主要系统发育群中经历重组的特定核心基因。系统发育群 2 中,频繁重组的基因涉及氨基酸转运(braE)、嘌呤降解(alc)等功能;系统发育群 1 中,与 II 型分泌系统(hxcX)、应对氧化应激等相关的基因频繁重组 。进一步计算四个重组指标发现,系统发育群 1 中重组的频率和影响大于系统发育群 2,且两个群在积累单核苷酸多态性(SNP)的倾向也不同。
3. 重组与防御系统的关系:研究人员推测,两个系统发育群针对噬菌体 DNA、可移动遗传元件等外源 DNA 的防御系统存在差异。分析发现,两个群的重组输出和防御系统数量均有显著差异,系统发育群 2 和 1 分别检测到 1,744 个和 5,194 个防御系统,且均包含五类防御系统,以核酸降解相关防御最为常见。同时,两个群中每个基因组的总重组序列长度与防御系统数量呈显著正相关 。
4. 共享辅助基因的网络结构:基于基因共现可能源于共同进化历史等假设,研究人员使用 Coinfinder 软件研究铜绿假单胞菌辅助基因组中的基因共现情况。在系统发育群 2 中,共鉴定出 901 个基因在共现网络中,包含 7,508 对共现基因和 19 个子网络,其中有与氟苯尼考耐药和多药外排泵相关的基因 。系统发育群 1 的共现网络包含 1,750 个基因和 31,549 对共现基因,聚集成 11 个子网络,存在与博来霉素、青霉素等耐药相关的基因 。两个群在毒力基因方面有一定相似性,但共现网络的结构存在差异,系统发育群 1 的节点和边更多,而系统发育群 2 的子网络更多。
讨论
本研究分析 840 个全球分布的铜绿假单胞菌基因组,揭示了两个主要系统发育群在核心基因组同源重组频率和特征、抗菌药物耐药(AMR)及毒力基因库和共现模式上存在差异,表明该菌作为机会致病菌的成功部分源于核心和辅助基因组中依赖谱系的 DNA 共享模式 。
重组在病原体进化中作用重大,本研究显示其在铜绿假单胞菌核心基因中产生多态性多样性,但不同系统发育群间重组速率和影响差异的原因尚不明确,可能与群间重组障碍有关 。此外,研究中观察到的频繁重组与先前报道不同,这可能是由于检测和估计重组的算法差异导致,凸显了量化细菌重组的难度。
两个系统发育群辅助基因共现模式不同,符合基因生态学概念,反映了各群经历的独特进化过程、面临的选择压力以及所处的生态微环境差异 。同时,系统发育群间泛基因组差异可能与针对外源 DNA 的免疫和防御系统变异有关,尽管样本数量差异会影响结果,但防御系统多样性和丰度可能对重组产生调节作用 。
全球铜绿假单胞菌种群包含多种流行和非流行克隆,流行克隆引发多数临床感染,其出现和传播与水平基因转移有关 。非流行克隆可作为 AMR 决定因素的重要储存库,不同克隆背景通过汇聚多样的 AMR 决定因素产生多药耐药性,毒力基因也是如此。本研究存在一定局限性,如基因组地理和生态代表性不均、包含草图基因组以及未研究跨物种基因转移等 。未来研究可针对这些问题展开,以进一步明确铜绿假单胞菌的进化机制和防控策略。
材料和方法
- 基因组收集、序列质量评估和注释:研究人员从公开数据库中检索了 1,000 个铜绿假单胞菌基因组序列数据,利用 QUAST v.5.0.2 和 CheckM v.1.1.3 评估基因组质量,排除完整性低于 90%、污染率高于 5%、contigs 数大于 200 且 N50 小于 40,000 bp 的基因组 。使用 FastANI v.1.32 对比基因组,排除平均核苷酸同一性(ANI)低于 95% 的基因组,最终得到 840 个高质量基因组用于后续分析,并使用 Prokka v.1.14.6 进行注释 。
- 泛基因组分析和系统发育树构建:运用 Panaroo v.1.2.7 确定泛基因组的核心和辅助基因内容,将存在于≥95% 基因组中的基因定义为核心基因,1% - 95% 基因组中的基因定义为辅助基因 。使用 MAFFT v.7.487 比对基因序列,SNP-site v.2.5.1 识别 SNP,RAxML v.8.2.12 构建最大似然系统发育树 。利用 fastBAPS v.1.0.6 将基因组划分为序列簇,并为各序列簇构建核心 SNP 系统发育树 。
- ST、抗菌药物耐药和毒力基因的计算机识别:借助 mlst v.2.19.0 程序,通过提取七个管家基因并与铜绿假单胞菌 PubMLST 数据库对比,确定 ST 。使用 ABRicate v.1.0.1 在基因组中识别 AMR 和毒力基因,设定序列覆盖度和序列同一性均大于 80% 为阈值 。
- 重组检测:以核心基因组比对结果为输入,利用 Mcorr 软件默认参数和 1,000 次自展重复计算重组率,该软件可估计六个进化参数 。运用 Gubbins v.3.2.1 通过滑动窗口法识别基因组中的重组区域,使用 snippy v.4.6.0 将基因组与参考基因组 PAO1 比对,确定重组基因,并用 RCandy 可视化重组事件 。
- 辅助基因组网络的识别:为探究共享辅助基因是否存在非随机共现,使用 Coinfinder v.1.0.7 程序,通过 Bonferroni 校正的二项式精确检验统计基因共现情况,并用 Gephi v0.9.2 将共现基因可视化为网络,从 UniProt 确定网络中基因的功能 。
- 抗噬菌体防御系统的检测:利用 DefenseFinder v. 2.0.0 和 MacSyFinder v.2 在计算机上检测针对噬菌体 DNA、可移动遗传元件和外源 DNA 的防御系统,DefenseFinder 通过同源搜索和隐马尔可夫模型分析与已知抗噬菌体系统相关的基因和基因结构 。
- 统计分析:运用 R v.4.3.1 中的 ggstatsplot v.0.12.1 和 ggplot2 v.3.4.4 进行统计分析和可视化 。使用 Welch’s t检验比较 Mcorr 参数,Pearson 相关检验和线性回归分析确定重组与细菌抗噬菌体防御系统的关系,P < 0.05 为具有统计学意义,除非另有说明,所有程序均使用默认参数 。