《Nature Microbiology》:Purine bias in bacterial genes is driven by runaway transcription
编辑推荐:
摘要:许多细菌的基因富含嘌呤核苷酸(腺嘌呤A和鸟嘌呤G),但该偏好性的起源尚不清楚。研究人员利用枯草芽孢杆菌(Bacillus subtilis)中的大规模报告基因文库筛选表明,这种嘌呤偏向对基因表达至关重要。它能防止在表现出失控转录(runaway tran
摘要:许多细菌的基因富含嘌呤核苷酸(腺嘌呤A和鸟嘌呤G),但该偏好性的起源尚不清楚。研究人员利用枯草芽孢杆菌(Bacillus subtilis)中的大规模报告基因文库筛选表明,这种嘌呤偏向对基因表达至关重要。它能防止在表现出失控转录(runaway transcription,即RNA聚合酶RNAP速度超过核糖体,使新生mRNA暴露于终止因子Rho)的物种中发生过早转录终止。这种易感性通过Rho增强的靶标特异性与编码链核苷酸组成之间的分化得以解决。避免Rho的选择压力似乎驱动了表现出失控转录的各物种中强烈的基因嘌呤偏向,但在丢失了rho基因的谱系中除外。这种嘌呤需求奠定了密码子使用偏向(codon usage bias)的基础,促进嘧啶富集反义转录本(antisense transcripts)的抑制,并能抑制工程载体的表达。研究结果表明,避免过早转录终止对基因组进化及外源基因适应过程中的核苷酸组成施加了主要约束。
论文解读——《Purine bias in bacterial genes is driven by runaway transcription》
本研究发表于《Nature Microbiology》。
研究背景与立项依据
在原核生物中,大肠杆菌(Escherichia coli)等典型革兰氏阴性菌的转录与翻译紧密偶联,紧随其后的核糖体可阻挡Rho因子结合新生RNA,从而避免Rho依赖的过早转录终止(Rho-dependent termination)。然而,部分低GC含量的革兰氏阳性菌如枯草芽孢杆菌(Bacillus subtilis, B. subtilis)存在转录-翻译解偶联现象,即RNA聚合酶(RNA polymerase, RNAP)速度超越核糖体,形成"失控转录(runaway transcription)",使新生mRNA裸露于Rho因子之下。尽管存在此风险,B. subtilis基因编码链却显著富含嘌呤(A+G),而反义链富含嘧啶(C+U),且Rho主要终止反义转录而非正义链转录,其机制不明。本文旨在探究细菌基因嘌呤偏向(purine bias)的起源及其与Rho因子、失控转录的关系。
研究人员通过全基因组规模报告基因筛选、序列特征分析、同义突变重编码及跨物种比较基因组学,证明B. subtilis Rho对富嘧啶(尤其是C和U)序列具高度特异性,基因为逃避Rho依赖终止而进化出嘌呤富集的编码序列。该选择压塑造了密码子使用偏向并影响外源基因表达。丢失rho基因的芽胞杆菌属(Bacilli)物种则丧失嘌呤偏向,证实Rho回避是嘌呤偏向的主要驱动力。
主要关键技术方法
研究人员构建了B. subtilis全基因组DNA片段(平均286 bp,覆盖基因组5.4倍)的大规模转录报告基因文库,将其整合至染色体,连接氯霉素抗性筛选系统,在有/无Rho抑制剂比西环霉素苯甲酸酯(bicyclomycin-benzoate, BCM-Bz)及Δrho背景下进行定向选择,通过深度测序定量Rho依赖终止片段。开发"Rho靶标评分(Rho target score)"——线性组合过量C含量(excess C)与150 nt窗口最大T含量(maximum %T)——预测终止活性。对B. subtilis内源基因brnQ及人生长激素(human growth hormone, HGH)进行同义突变提高嘧啶含量验证Rho敏感化;比对309种芽胞杆菌及1002种细菌基因组,分析含rho与不含rho物种编码链嘌呤过剩量(excess purine content = (A+G?C?U)/长度),并统计四密码子简并氨基酸第三位嘌呤使用频率。
结果部分
Genome-wide mapping of Rho termination(Rho终止的全基因组定位)
研究人员利用上述报告文库在±BCM-Bz及Δrho菌株中筛选,鉴定出约10,000个Rho依赖终止片段,其中仅1%完全重叠于基因编码区(起始文库中占29%),说明Rho终止信号在B. subtilis中被广泛排除于mRNA编码序列之外,与假设相符。
Specificity of Rho-dependent termination(Rho依赖终止的特异性)
分析Rho终止片段发现两个特征:长区段C含量相对G高(excess C)及150 nt窗口内高T含量。二者组合的Rho target score可区分终止与非终止片段。将非Rho调控基因brnQ进行同义突变为富C/U版本后,在野生型B. subtilis中诱发Rho依赖终止,Δrho背景恢复表达,证明嘧啶富集序列本身足以诱导B. subtilis Rho终止,且B. subtilis Rho比E. coli Rho序列特异性更强。
Rho avoidance drives gene purine bias(Rho回避驱动基因嘌呤偏向)
B. subtilis编码链嘌呤含量54% vs 嘧啶46%,反义链反之。丢失rho基因的Bacilli物种编码链嘌呤偏向显著减弱;将rho缺失物种的brnQ同源基因在B. subtilis中表达则被Rho终止,证实嘌呤偏向是Rho存在下的适应性特征。复制前导链与滞后链基因均显示相似嘌呤富集(前导链53–54%,滞后链53%),排除复制突变偏向为主因,支持转录方向选择压说。
Purine bias illuminates a hidden code(嘌呤偏向揭示隐性编码)
含rho的Bacilli在四简并密码子第三位显著偏好嘌呤结尾密码子(如GGN中GGG/GGA优于GGC/GGU),部分氨基酸替换亦倾向选择嘌呤更多组合,说明避免Rho的嘌呤需求在密码子使用层面施加了隐藏约束。外源序列(如HGH)因嘧啶偏高被B. subtilis Rho终止,同义突变为嘌呤富集版本可恢复表达,表明该隐藏码构成外源基因表达屏障并可能限制水平基因转移。
预测具失控转录的细菌门(Bacillota, Fusobacteria等)编码链均呈嘌呤偏向,而预测转录-翻译偶联物种无此偏向,提示该序列保护机制广泛适用于具失控转录的细菌。
讨论与结论翻译
研究人员发现许多细菌基因组通过进化使其编码序列具强烈嘌呤偏向以逃逸失控转录中的终止。该核苷酸编码决定了遗传密码的偏向性使用,显著影响基因表达水平及外源遗传元件命运;反义转录本具相反的嘧啶偏向,与B. subilis Rho增强的特异性匹配,使Rho维持其作为广谱转录监控因子抑制异常转录的功能。嘌呤与嘧啶在编码链与非编码链的大尺度分离构成了塑造细菌基因组的新轴,独立于广受关注的GC–AT含量。B. subtilis中Rho终止序列特异性高于E. coli可能源于更快的RNAP延伸速率动力学竞争Rho加载、RNAP在T丰富区的暂停及NusG/NusA等反式作用因子差异。除Rho回避,微弱的基础嘌呤偏向也存在于无失控转录或无Rho的物种,可能源于短暂偶联失效时的弱Rho敏感化或DNA复制突变偏向。研究表明基因序列优化不仅受翻译影响,还需满足各中心法则步骤(如转录终止逃避)的要求,单一转录因子可对编码约束产生深远影响。