Apobec3在家鼠亚种中快速进化及内源性小鼠乳腺肿瘤病毒异常超突变模式的揭示

【字体: 时间:2025年09月17日 来源:Journal of Virology 3.8

编辑推荐:

  本综述系统阐述了Apobec3(A3)基因在小鼠亚种间的快速进化特征及其对内源性小鼠乳腺肿瘤病毒(Mtvs)的超突变作用。研究发现A3通过胞苷脱氨酶活性引发病毒DNA的G>A突变,导致Mtvs基因组完整性受损,并鉴定出20种A3单倍型与正选择特征。该研究为宿主-病毒共进化机制提供了重要见解,对逆转录病毒防控策略具有启示意义。

  

ABSTRACT

Apobec3(A3)作为载脂蛋白B编辑复合体3成员,是一种具有广谱抗逆转录病毒活性的胞苷脱氨酶。该酶被包装进病毒颗粒,在逆转录过程中将病毒负链DNA中的胞苷转化为尿嘧啶(C>U),导致病毒正链出现鸟苷到腺苷(G>A)的突变。小鼠Apobec3(mA3)能够诱变多种感染性逆转录病毒和部分内源性逆转录病毒家族。本研究显示,内源性小鼠乳腺肿瘤病毒(Mtvs)呈现从痕量水平到极端程度的mA3超突变谱,其中Mtv21经历了灾难性的全基因组G含量降低至10.8%,这种突变水平与通过连续胞苷突变产生新的偏好性三核苷酸靶位点相关。尽管新插入的前病毒具有相同的长末端重复序列(LTRs),但mA3能够特异性针对Mtv 3′ LTR产生不成比例的G>A替换。个体超突变Mtvs表现出两种不同的mA3靶位点上下文偏好性,分别对应近交系实验室小鼠中发现的两种mA3等位基因。对携带Mtv的Mus musculus亚种进行mA3等位基因筛查时,意外发现20种不同的mA3单倍型,这些单倍型在区分两种近交系等位基因的15个位点上呈现不同的替换突变组合,其中11个位点显示正选择特征。这些数据表明mA3脱氨作用对Mtvs基因组完整性具有重大影响,且mA3在该单一鼠种内持续进化,暗示在较短进化时间框架内存在高强度遗传冲突。

IMPORTANCE

抗病毒胞苷脱氨酶Apobec3(载脂蛋白B编辑复合体3)在新感染过程中突变逆转录病毒DNA拷贝。尽管此前报道显示复制中小鼠逆转录病毒的此类突变作用有限,但本研究证实许多小鼠乳腺肿瘤病毒(Mtvs)的种系拷贝经历了显著至大规模的小鼠Apobec3(mA3)编辑。mA3超突变还能不成比例地影响两个原本相同的病毒长末端重复序列之一,并通过连续胞苷突变在病毒基因组底物中创建新的偏好性靶位点。个体Mtvs中的编辑事件与两种近交系小鼠mA3等位基因的不同靶序列偏好性相对应,但对Mus musculus物种野生小鼠等位基因变异的检测发现了18个额外变异和多样化选择特征,这在单一物种短时间框架内展现了异常快速的进化过程。

INTRODUCTION

易感感染性逆转录病毒(XRVs)的物种编码针对逆转录病毒生命周期不同阶段的抗病毒因子。Apobec3(A3)作为此类因子之一,在病毒复制的进入后阶段发挥作用。在包括人类和小鼠在内的哺乳动物物种中发现的直系同源物具有抗多种逆转录病毒的活性。A3是一种被纳入出芽病毒颗粒的胞苷脱氨酶,在随后感染细胞的逆转录过程中,病毒颗粒相关的A3催化病毒负链胞苷向尿嘧啶(C>U)的脱氨作用,导致病毒正链产生鸟苷向腺苷(G>A)突变,从而影响病毒适应性。A3还通过独立的非脱氨机制抑制逆转录病毒复制,该机制通过抑制逆转录过程实现。

A3是APOBEC/AID基因家族成员。研究最广泛的A3直系同源物是人类APOBEC3G(hA3G),这是灵长类中八个旁系同源物(hA3A–H)之一,其中大多数具有抗病毒特性。在小鼠中,单个Apobec3基因(mA3)拥有两种序列、表达水平和剪接方式不同的等位基因变异,这些因素都能影响其抗病毒活性。hA3G限制多种感染性病毒包括HIV-1和其他慢病毒与逆转录病毒,mA3同样限制HIV-1以及小鼠乳腺肿瘤病毒(MMTVs)和某些小鼠白血病病毒(MLVs)。哺乳动物基因组携带插入宿主染色体的逆转录病毒基因组DNA拷贝,称为内源性逆转录病毒(ERVs);一些人类和小鼠ERV家族显示超突变证据,mA3还能抑制其逆转座。mA3敲除小鼠对MMTV感染更敏感,过表达人类AID/APOBEC家族成员的转基因小鼠显示超突变和肿瘤发生水平增加。hA3G和mA3在灵长类和啮齿类中均显示正选择证据,表明存在遗传冲突的进化历史。

多种被A3靶向的逆转录病毒编码可拮抗A3的辅助因子。HIV-1通过辅助蛋白Vif(病毒 infectivity因子)避免hA3G抑制,Vif促进hA3G泛素化,导致其蛋白酶体降解。mA3也能被两种MLV gag基因产物抑制:p50阻止mA3包装,glyco-Gag通过稳定病毒核心阻止mA3接触病毒基因组。

虽然既往研究表明mA3抑制MMTVs的感染性和致病性,但观察到MMTV感染小鼠获得的前病毒对mA3超突变相对不敏感。然而,我们对29个内源性MMTVs(称为Mtvs)的检查显示明确的超突变证据,范围从边缘水平到大规模程度,并确定了区域突变案例,包括四个Mtvs在其3′而非5′ LTRs中发现G>A突变。个体超突变Mtvs表现出不同的G>A突变偏好靶位点上下文,与经典近交系中发现的两种mA3等位基因相对应。近交系仅有两种mA3等位基因,但对携带这两种等位基因的家鼠亚种筛查时,意外发现18个额外的mA3变异,这些变异以区分两种近交系等位基因的15个位点上不同替换突变组合为特征,其中11个位点处于正选择下,这是在单一物种内显著快速进化的罕见表现。

RESULTS

Mtvs的mA3超突变

对从17个测序的近交系小鼠品系和野生小鼠类群基因组中提取的29个Mtv ERVs进行了mA3编辑评估。在缺乏这些Mtvs可识别祖先的情况下,我们将实验室品系和Mus musculus亚种的Mtvs与无缺陷的Mtv1进行比对;在无缺陷Mtvs和感染性MMTVs中,Mtv1是与Mus musculus MMTVs最接近的匹配。七个2-LTR Mus spretus Mtvs与实验室小鼠MMTVs亲缘关系较远,因此改用该组的共有序列进行比对。由于LTR编码的sag基因C末端存在广泛变异性,比对范围从gag起始到3′ LTR中sag基因N端三分之二段,在Mtv1中该片段长7,924 bp。

表格1描述了21个具有编码序列的Mtvs的mA3突变谱。评估了Mtvs的G>A、C>T和A>G突变。超突变可通过明显的G>A突变过量识别。mA3编辑倾向于负链特异性,因此病毒正链中G>A变化多于C>T变化,且是单向性的,以G>A相对于A>G突变为主导。列表中的Mtvs显示广泛范围的超突变,超过一半显示至少两倍的G>A突变过量。在测序小鼠基因组的六个Mtv单独LTRs中未检测到超突变,但在野生小鼠DNA中克隆的Mtv env、pol和sag序列中存在一些案例。虽然随机突变预期会产生相等数量的不同错配,但Mtv61的5′端具有几乎两倍于C>T的A>G错配数量,且A>G错配多于G>A错配,这提示RNA腺苷脱氨酶(ADAR)的诱变作用。

A3活性还以连续胞苷(C tracts)突变为标志,在病毒基因组中产生连续的G>A突变。A3诱变还能创建提前终止密码子、禁用ATG起始位点并产生非同义突变。所有全长Mtvs除一个外都携带至少两个开放阅读框(ORFs)。这些Mtvs中的功能失调编码区共同包含36个独特终止密码子,均为突变的色氨酸密码子(TGG)。对四个超突变Mtvs进行了由G>A突变引起的氨基酸替换分析;对于大多数基因,超过一半的G>A错配改变了氨基酸序列。

经历极端编辑或显示超突变梯度的个体Mtvs

在测序的NZO/HILtJ品系基因组中发现的Mtv21和野生来源CAST/EiJ小鼠中的Mtv61携带异常数量的G>A错配。由于mA3超突变优先靶向特定二或三核苷酸,这些Mtvs中存在多个共享错配。Mtv21的整体前病毒G含量仅为10.8%(env中为8.3%),相应的A含量增加至41.8%。该前病毒还显示多个连续的G>A替换,是这些Mtvs中唯一没有ORFs的。这种程度的超突变特异性针对Mtv21序列,因为围绕该Mtv的4 kb细胞DNA未显示此类模式,且与C57BL/6(B6)参考基因组中的同源片段>99.6%相同。因此,这种嵌入式前病毒的极端编辑不是持续诱变的结果。

对高度突变的Mtvs(Mtv17、21、57、61和62)以及一个编辑证据较少的Mtv7进行了超突变滑动窗口分析。Mtv21、17、57和62在其基因组中显示超突变,尽管编辑程度最高的Mtv21显示出比其他更少的极端局部变异性。相比之下,Mtv61显示剧烈的超突变梯度下降,其基因组5′半部G>A替换急剧减少,这种梯度不同于hA3G在HIV-1中产生的突变梯度。

将Mtv21和Mtv61 3′部分的极端超突变水平与超编辑ERVs目录进行比较。这两个Mtvs显示每1,000 bp最高数量的G>A突变。就其总突变谱而言,这些Mtv水平与报道的最高超编辑ERV例子相当,发现于斑胸草雀和小鼠的IAPs(胞内A型颗粒)。在病毒感染细胞中产生的超突变前病毒中,最高超突变水平报道于Vau-O HIV-1,但Mtv21显示更多G>A错配。高水平的HIV-1编辑也在人类患者外周血单核细胞(PBMCs)中报道,测量为hA3G二核苷酸靶序列的饱和。

多个Mtvs携带其3′ LTRs特有的G>A突变

当ERVs形成时,侧翼LTRs是相同的,但随着时间的推移,它们独立获得突变并在序列上分化。Mtvs是相对近期加入小鼠基因组的(50万年前),因此预期显示最小的LTR变异。事实上,21个2-LTR Mtvs中有17个具有相同的LTRs。四个例外(Mtv17、Mtv21、Mtv61、Mtv62)显示明确的mA3突变证据遍布其基因组。这些Mtvs中的两个LTRs各自具有多个共享超突变,但也分别携带13、16、2和9个区分两个LTRs的核苷酸替换。除一个外,所有这些错配都是3′ LTR特有的G>A突变;唯一例外是Mtv21 3′ LTR中的一个A>G突变。这四个Mtvs中的LTR差异不是测序错误,因为相同的Mtv17副本由八个近交品系(129、AKR、C57BL/6、CBA、DBA、FVB、LP、NOD)的测序基因组携带,并且对其他三个Mtvs的两个LTRs重新测序证实了这些LTR差异。

这些额外突变是由mA3诱导的观点得到以下事实支持:在3′ LTR特有的G>A错配中存在六个连续G>A突变的例子,Mtv21和Mtv17中各三个,这是A3超突变的标志;并且在这四个Mtvs的39个G>A突变中,相同的三个位点在Mtv62和Mtv17中突变,相同的一个在Mtv62和Mtv21中突变,与A3靶上下文特异性一致。

除两个外,3′ LTR特有的突变都在U3中,U3构成Mtv LTR的主要部分,也编码Sag并携带转录因子结合位点。3′ LTR的功能性可能对宿主产生后果,因为Sag production可影响对MMTV感染的易感性,并且LTR启动子可改变附近宿主基因的表达。虽然Mtv61和21的sag基因由于产生移码的indels而有缺陷,但Mtv62和Mtv17具有sag ORFs,添加的3′ LTR突变分别产生七个和八个氨基酸替换。Mtv17和62中共享的三个错配位于sag的C末端,与Sag特异性和限制外源性MMTV感染的能力相关,因此这些Mtvs的持续存在可能由于对宿主可选择的适应性益处。U3中转录因子结合位点的突变也可能对宿主基因调控产生影响。

这种前病毒LTRs中的G>A差异此前未在其他逆转录病毒中报道,因此我们检查了MLV ERVs的LTRs,其获得大致与Mtvs同时发生。一个MLV,Mpmv5,具有四个其3′ LTR特有的G>A突变,表明这种现象并非Mtvs特有。九个额外的MLV ERVs具有区分其LTRs的单个突变,其中三个携带3′ LTR特有的G>A替换(Pmv23、Mpmv7、Mpmv46)。

具有不同LTRs的Mtvs之一,Mtv17,与Mtv23几乎相同。这两个ERVs共享相同的整体超突变模式并携带相同的其他全基因组突变集。Mtv17和Mtv23定位到不同染色体,具有不同的靶位点重复,并由不同的近交品系亚组携带。然而,两个Mtv23 LTRs是相同的,并且具有与Mtv17 3′ LTR相同的超突变模式,包括未在Mtv17 5′ LTR中发现的13个额外G>A变化。这表明Mtv23是Mtv17的一个副本,其两个LTRs均源自Mtv17 3′ LTR。

靶位点上下文依赖性

来自不同物种的A3蛋白靶向特征性二或三核苷酸。在 newly infected cells 中的mA3编辑的HIV-1或MLV前病毒以及各种小鼠ERVs(包括IAPs、MusD逆转座子和MLVs)中已鉴定出两种靶位点上下文。这些位点上下文偏好性(靶位点下划线)为XTC或T(T/C)C,或在正链上可见为GAX或G(G/A)A。虽然因此mA3被描述为在其偏好靶位点上不如其他A3严格,但观察到的位点已被鉴定为近交系BALB/c(mA3BALB)和C57BL/6(mA3B6)中发现的两种mA3等位基因变异的靶位点偏好。mA3B6更偏好T(T/C)C,而mA3BALB偏好XTC。

我们分别检查了五个高度超突变Mtvs中每组编辑的上下文依赖性。虽然所有五个Mtvs中超突变的最常见靶点是TTC(正链上为GAA),但-1和-2位置的不同核苷酸影响突变可能性。三个Mtvs(Mtv17、57、62)显示对T(T/C)C的mA3靶位点偏好,而两个Mtvs(Mtv21、Mtv61)显示XTC偏好。我们还分别检查了Mtv61的3′和5′半部的靶位点偏好。具有高水平超突变的3′半部显示对XTC的偏好,而5′端的有限超突变显示对T(T/C)T的边缘偏好。Mtv61中这种明显的病毒中部靶位点差异转换,加上其基因组中超突变程度的异常急剧变化,表明Mtv61可能是一个重组体。

由于靶位点特异性导致不同前病毒中的共享突变,我们使用每组集合中仅共享位点重新检查了这两组编辑的Mtvs,以消除弱靶点和与mA3编辑无关的突变。对Mtv17、57和62进行了任何两个前病毒之间共享位点的评分,并且Mtv21和Mtv61中共享G>A位点的分析仅包括跨越Mtv61超突变3′端的片段。对于两个子集,这产生了与相同两个靶位点的更强关联,以Mtv21和61中-1位置T的重要性增强,以及Mtvs 17、57和62中-2位置T的重要性增强为标志。这与不同Mtvs组被不同mA3变异改变的结论一致。

负链中的C tracts可以承受连续的mA3突变,最显著地见于Mtv21,但C tracts不包含mA3的任一偏好靶位点。我们最初的靶位点分析基于每个突变是独立的假设,并且靶位点由参考序列定义。然而,突变在C tracts中的集中表明,持续诱变可能通过将CCC三核苷酸转化为mA3敏感的TTC、CTC或TCC来创建新的、立即可用的靶位点。由于Mtv21和Mtv61中异常高数量的C tract突变,可见为正链上连续的G>A突变,我们重新分析了这些Mtvs中的突变,排除了共享突变中-1和-2位置有C>T突变的那些位点。这些“独立”突变显示一个靶位点谱,其中-1位置T的参与增强。这表明使用未改变的参考序列定义靶位点上下文扭曲了分析,因为mA3位点选择可能受到同时发生的相邻C>T突变的影响。这解释了超突变的聚集,以及整体诱变水平的增加。

因此,不同的Mtvs显示两种mA3靶位点偏好之一,表明它们已被不同的mA3变异脱氨,并且进行性的mA3突变可以创建新的靶位点,产生连续的

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号