编辑推荐:
这篇综述聚焦细菌基因组结构变异(SV),探讨其在细菌中的普遍性、产生机制,通过伤寒沙门氏菌、百日咳鲍特菌等案例分析其对细菌表型、适应性和进化的影响,还讨论了研究挑战及未来方向,对理解细菌特性和防控相关疾病意义重大。
细菌基因组结构变异研究进展
在微生物学领域,细菌基因组测序已成为常规研究手段。截至 2024 年 12 月,GenBank 中存有近 240 万条细菌基因组序列,但大部分由短读测序产生。短读测序虽能覆盖大部分基因组,却因基因组中存在比短读序列更长的重复序列(如插入序列元件、核糖体 RNA 操纵子),导致组装困难,难以确定基因组结构,多数序列为包含多个重叠群的草图基因组,完整基因组占比不足 2.5% 。草图基因组主要用于分析基因的存在与否和短碱基序列变化(如单核苷酸多态性 SNP、短插入缺失 indel),目前对细菌基因组变异的认知多基于此。
长读测序技术的出现为基因组研究带来新突破,它能产生跨越重复序列的长读长,进而生成完整(封闭)的基因组序列。牛津纳米孔技术等长读平台的广泛应用,使完整基因组的可得性迅速增加。不过,目前在传统变异分析(如 SNP 分型)中,基因组结构评估尚未成为常规操作。
基因组结构变异(SV)指基因组中 DNA 片段顺序因重组而改变的现象,主要是围绕长重复序列(如转座酶、重复基因、原噬菌体、插入序列元件、核糖体操纵子)的同源重组。这种重组可导致 DNA 片段的倒位、易位、缺失和拷贝数扩增等重排,影响基因组的功能和细菌的表型。
细菌基因组结构变异的后果:案例研究
伤寒沙门氏菌(Salmonella Typhi)与其他沙门氏菌菌株相比,基因组结构具有显著差异,能容忍大量基因组重排。早期研究利用脉冲场凝胶电泳和长程 PCR 发现,这主要是 7 个核糖体操纵子之间同源重组的结果。
有研究提出,重排可能是一种补偿性突变,用于恢复因水平基因转移等事件导致的复制子失衡(ori - ter balance)。从平衡基因组菌株克隆的菌落中,重排现象罕见;而从极端不平衡基因组菌株培养的菌落,基因组结构变化多样,菌落大小各异。大菌落通常与更好的 ori - ter 平衡和更快的生长速率相关,小菌落则保留亲本的不平衡结构。这表明基因组重排可通过恢复平衡和优化 DNA 复制时间来提高细菌适应性。
转录组数据证实,基因组重排会显著改变基因表达。重排后靠近复制起点的基因上调,远离的则下调,这有助于抑制鞭毛生产等耗能过程,体现了重排在压力适应中的作用,与伤寒沙门氏菌在胆囊恶劣环境中持续感染的能力相符。对慢性携带者体内分离菌株的基因组结构分析发现,不同菌落存在不同基因组结构,多数结构平衡,表明自然环境中对高度不平衡基因组的重排存在选择压力。
百日咳鲍特菌(Bordetella pertussis)的基因组测序早期,通过桑格双脱氧链终止测序获得了部分菌株的封闭序列,发现其与支气管败血鲍特菌在基因组成相似的情况下,基因组排列差异显著。百日咳鲍特菌基因组中约有 250 个 IS481 拷贝,其进化过程涉及 IS481 的获取和扩增,引发大量基因组内重组,导致倒位、易位和缺失,使基因组丢失超过 1 兆碱基对的 DNA。
长读测序技术应用后发现,IS481 重复序列间的基因组内重组仍在频繁发生,这是百日咳鲍特菌基因组变异的主要来源。IS481 可通过转座酶启动子的通读转录和外向启动子(Pout)影响邻近基因转录。例如,Pout产生的针对邻近 fim2 基因的反义 RNA 可降低 Fim2 蛋白表达,缺失该反义 RNA 的突变株 Fim2 蛋白表达增加且细胞毒性增强,表明 IS481 的位置可影响基因表达和细菌表型。
此外,对百日咳鲍特菌基因组序列读长深度分析发现存在串联重复区域,即拷贝数扩增现象。不同菌株中某些区域的扩增更为常见,暗示这些热点区域受到选择。但拷贝数扩增在基因组序列组装时易被忽略,其对百日咳鲍特菌表型的影响尚不明确。
抗生素异质性耐药(HR)指在对某种抗生素敏感的细菌群体中,存在一小部分对抗生素具有更高抗性的亚群。HR 常与治疗失败相关,其主要原因是基因拷贝数的动态扩增,尤其是抗生素抗性基因,通过形成串联阵列增加抗性基因剂量,从而提高抗性决定因子的表达。
拷贝数扩增与某些类型的抗性基因(如编码 β - 内酰胺酶的基因)关联更紧密,在某些抗生素类别中更为普遍。例如,在对大肠杆菌、肺炎克雷伯菌、鼠伤寒沙门氏菌和鲍曼不动杆菌的临床分离株测试中,部分原本被定义为敏感的细菌 - 抗生素组合实际存在异质性耐药。
以肺炎克雷伯菌为例,一株多重耐药菌对多种抗生素表现出 HR,抗性源于基因拷贝数变化,且存在多种拷贝数变化机制,包括质粒上抗性基因的串联扩增、整个质粒拷贝数增加以及抗性基因转座到隐蔽质粒后该质粒拷贝数增加。这些变化导致基因组大小显著增加,且拷贝数扩增对不同抗生素最小抑菌浓度(MIC)的影响存在差异,且具有不稳定性,去除抗生素选择压力后会以不同速率恢复。在小鼠肠道定植模型中,即使抗性亚群频率低至10?5 ,在抗生素作用下也会迅速富集。
研究结论与未来展望
短读测序在细菌基因组分析中的主导地位掩盖了基因组结构变异的普遍存在。虽有工具可从短读数据中识别 SV,但解析特定基因组结构需长读测序数据。现有 Socru、PaReBrick 等生物信息学工具可用于研究细菌结构变异,但拷贝数扩增仍是基因组序列组装面临的难题。
基因组结构变异的高度动态性使细菌结构具有异质性,影响基因表达研究,且难以用单一序列描述。改进 SV 异质性的可视化需要相关工具开发者的合作。
目前虽不清楚细菌中 SV 的全貌,但它对基因组学应用的重要领域(如细菌病原体监测、推断抗生素抗性)产生影响。随着对 SV 作为基因型和表型决定因素的认识加深,以及长读测序获取基因组结构信息的便利性提高,未来对 SV 的研究将聚焦于其发生机制、对细菌特性的影响,以及如何在基因组监测中更好地纳入 SV 分析,以应对细菌感染相关的公共卫生挑战。