综述:神奇的AAV衣壳:进入结构宇宙

《Molecular Therapy Methods & Clinical Development》:The amazing AAV capsids: Into the structure-verse

【字体: 时间:2025年11月23日 来源:Molecular Therapy Methods & Clinical Development 4.7

编辑推荐:

  本综述系统梳理了腺相关病毒(AAV)衣壳结构生物学近25年的研究进展,重点阐述了高分辨率结构揭示的衣壳保守特征与可变区域(VRs),及其在受体识别、抗体中和与细胞内运输中的作用。文章强调了结构生物学在理性设计新型AAV载体(如PHP.eB、AAV-DJ)中的核心驱动作用,为优化基因治疗载体的组织特异性、转导效率及免疫逃逸提供了关键见解。

  

引言

腺相关病毒(Adeno-associated virus, AAV)最初在20世纪60年代作为腺病毒制备物中的污染物被发现,如今已成为治疗多种单基因疾病最有前景的体内基因递送载体。截至2025年,已有八种基于AAV的疗法获得欧洲药品管理局和/或美国食品药物管理局批准商用,例如用于治疗脂蛋白脂肪酶缺乏症的AAV1载体Glybera、治疗Leber先天性黑蒙症的AAV2载体Luxturna、治疗1型脊髓性肌萎缩症的AAV9载体Zolgensma等。此外,基于AAV的基因治疗临床试验数量近年来激增,截至2025年已超过300项。
AAV载体来源于细小病毒科(Parvoviridae)依赖病毒属(Dependoparvovirus),其无包膜二十面体衣壳具有T=1对称性,直径约25纳米,内部包装约4.7 kb的线性单链DNA(ssDNA)基因组。AAV基因组包含两个大的开放阅读框——rep基因和cap基因,两侧为两个相同的反向末端重复序列(ITRs)。rep基因编码最多四种Rep蛋白(Rep40、Rep52、Rep68、Rep78),这些蛋白对基因组复制和包装至关重要;而cap基因编码衣壳蛋白,包括病毒蛋白(VPs)VP1、VP2和VP3,它们以大约1:1:10的比例表达。这三个VP的C端重叠,VP1包含VP2和VP3的序列。VP1独特的N端称为VP1独特区(VP1u),VP1和VP2共享的N端序列称为VP1/2共同区。VP1u包含一个必需的磷脂酶A2(PLA2)结构域,而VP1/2共同区包含核定位信号,两者在AAV病毒生命周期中都至关重要。虽然VP1对AAV感染性是必需的,但VP1和VP2并非衣壳组装所必需。此外,AAV基因组还编码两个较小的蛋白质:组装激活蛋白(AAP)和膜相关辅助蛋白(MAAP)。
在生成AAV载体时,野生型基因组的rep和cap基因被替换为转基因载体盒,仅保留侧翼的ITR(通常来自AAV2),作为重组载体基因组的包装信号。Rep蛋白(通常也来自AAV2)和VPs(任何衣壳基因)通过反式表达。利用这种设置,载体基因组被包装到衣壳中,取代野生型基因组。常见的生产流程使用HEK293细胞或昆虫Sf9细胞进行AAV载体生产。选择“合适的”衣壳基因对最终产生的AAV载体至关重要,因为生成的衣壳决定了载体的趋向性和抗原性,并可能影响特定疗法的成功。
因此,人们对AAV衣壳的表征和改进进行了大量研究。确定AAV衣壳结构是实现这些目标的关键,也是本综述的重点。

AAV衣壳形态

早期的AAV透射电子显微镜图像揭示了病毒颗粒的无包膜性质。在确定了各种RNA病毒的第一个衣壳结构后,AAV衣壳也被假定具有二十面体对称性。对AAV衣壳的首次结构认识来自于约10埃分辨率的AAV2低温电子显微镜(cryo-EM)重构,该重构揭示了围绕三次对称轴的大突起和五次对称轴处的狭窄通道。2002年,通过X射线晶体学以3埃分辨率确定了AAV2衣壳的结构,这标志着AAV衣壳结构表征的开始。AAV2结构以及此后确定的其他AAV衣壳结构(例如AAV5、AAVrh.8和AAVhu.37)显示,无论使用何种方法,只有共享的VP3区域(约520个C端氨基酸)在结构上是有序的,而VP1u、VP1/2共同区以及VP3 N端约15个氨基酸则未被观察到。当将仅由VP3组成的AAV1和AAV3衣壳与包含所有三种VP的衣壳进行比较时,这一点得到了进一步证实,这些衣壳在结构上无法区分。
AAV的VP结构,类似于所有二十面体单链DNA病毒,包含一个由八条链(βBIDG和βCHEF)反平行β桶基序形成的果冻卷折叠结构。此外,βBIDG片层由βA链延伸,该链与βB链反平行。β(A)BIDG片层形成衣壳的内表面,并且比大部分埋在衣壳内部的BCHEF片层更大。此外,在βC和βD链之间插入了一个保守的α螺旋(αA)。这些二级结构元件构成了衣壳的构建模块,并且在AAV以及细小病毒亚科其他属(包括阿姆多病毒、鸟病毒、博卡病毒、红病毒、原病毒和四病毒)中保守,这些属的结构已被确定。衣壳表面由β链之间的互连环形成。这些环根据其侧翼的β链命名——例如,连接βE和βF链的环称为EF环。在AAV中,BC、DE、EF、GH、HI和C端环共同构成了衣壳的表面拓扑特征。长的GH环由超过200个氨基酸组成,形成几个子环。这些表面环在不同的AAV之间以及细小病毒亚科不同属的成员之间表现出高度的氨基酸序列多样性和结构变异性。
尽管不同AAV的VP序列在氨基酸同一性上差异高达50%,但它们的衣壳共享共同的形态特征。为了形成二十面体AAV衣壳,60个VP单体通过2重、3重和5重对称相互作用组装。这些相互作用导致在二十面体5重对称轴处由五个DE环形成圆柱形通道。5重通道将衣壳内部与外部环境连接起来,并被认为在基因组包装/排出以及VP1u外化中起重要作用。围绕3重对称轴,AAV衣壳拥有主要由GH环形成的大突起。衣壳最浅的区域位于2重对称轴和5重孔周围,C端环和HI环分别对此有贡献。这些凹陷区域之间的隆起区域称为2/5-fold壁,由BC、EF和部分C端环形成。虽然所有AAV都保留了这些整体表面特征,但不同的环构象和氨基酸序列导致衣壳表面的外观不同,随后导致可变的受体使用,这有助于形成不同的宿主和组织趋向性以及抗原谱。

基于灵长类的AAV衣壳

最初从人类或非人类灵长类细胞和/或组织中分离出的AAV被称为AAV血清型。历史上,AAV血清型通过血清学研究、其基因组的物理化学表征、限制性内切酶消化模式以及后来的序列进行区分。然而,在发现VP1衣壳序列与AAV1仅相差六个氨基酸的AAV6之后,由于测序技术的进步,发现了越来越多的AAV分离株,它们与先前描述的AAV血清型也只有几个氨基酸的差异。因此,在血清型13之后停止了新AAV血清型的命名,AAV被重新组织成进化枝。AAV的进化枝组织最早于2004年提出,基于来自人类和非人类灵长类动物(包括恒河猴、食蟹猴、猪尾猴、狒狒和黑猩猩)的100多个独特分离株。它们是根据其衣壳蛋白序列的邻接法系统发育树定义的,因为rep基因序列通常未被测序或保存。这导致了六个进化枝的形成,以AAV血清型作为原型成员(进化枝A:AAV1和AAV6;进化枝B:AAV2;进化枝C:AAV3和AAV13;进化枝D:AAV7;进化枝E:AAV8和AAV10;进化枝F:AAV9)。AAV4被归类为一个克隆,后来被建议与AAV11和AAV12一起形成进化枝G。类似地,AAV5被归类为一个克隆,在AAV界有时与AAVgo.1等非灵长类AAV一起被分配到进化枝H。
如上所述,AAV2是第一个其衣壳被结构表征的AAV血清型。此后,除AAV10外,所有13个AAV血清型的衣壳结构均已被确定。然而,结构组合通过AAVrh.39得到了补充,其在VP3区域与AAV10仅有一个氨基酸取代(A589T)的差异。此外,还确定了AAVrh.8、AAVrh.10、AAVrh.4282、AAVhu.37和AAVhu.69的衣壳结构。虽然灵长类AAV衣壳的氨基酸序列同一性范围在51%到99%之间,但它们的衣壳在外行人看来可能完全相同。然而,这些衣壳的一个可区分特征是3重突起的形状。由于表面环的构象差异、缺失和/或插入,这些突起可以径向向外突出更远,显得更“尖锐”,如AAV2的情况;或者径向更短、更“圆润”,如AAV5衣壳所示。这导致AAV2成为最大直径(约30纳米)最大的AAV衣壳之一,而AAV5是较小的AAV衣壳之一(约28纳米)。然而,两者在2重凹陷处的直径基本相同。当使用二级结构匹配算法叠加VP单体时,可以进一步可视化这些结构差异。虽然所有基于灵长类的AAV衣壳的核心及其二级结构元件几乎相同,但在它们的表面环中观察到显著的结构差异。这些相似性和差异性导致18种灵长类AAV衣壳的VP结构的Cα原子位置平均均方根偏差(Cα RMSD)约为0.8埃。

AAV的可变区域

2006年,第二个衣壳结构(AAV4)的确定使得能够对两种不同AAV进行结构比较。使用二级结构匹配,将AAV2和AAV4的VP3模型叠加,整体Cα RMSD为1.0埃。虽然衣壳核心显示两个结构的坐标几乎完全重叠,但在表面环中观察到显著的位置差异。在叠加的衣壳之间确定了九个结构可变性区域,定义为两个或更多连续氨基酸,其Cα位置位移大于1埃。这九个可变区域(VRs)最初用罗马数字编号;然而,一些出版物也使用阿拉伯数字。即使确定了许多额外的AAV衣壳结构后,VR在VP结构中的位置仍然保持一致。它们分别位于:VR-I在BC环,VR-II在DE环,VR-III在EF环,VR-IV至VIII在大的GH环内,VR-IX在BI链后的C端附近。在衣壳内,VR-I、III和XI形成2/5-fold壁;VR-II在5重对称轴处形成通道;VR-IV、V和VIII相互作用形成3重突起;VR-VI和VII位于3重突起的基部。
值得注意的是,如果VRs的第一个描述是基于AAV2和AAV5衣壳结构的比较,那么HI环将被包括在VRs中,而VR-VIII则不会,因为该环不符合上述对于这些AAV的定义。因此,本综述重新审视了已确定衣壳结构的全套灵长类AAV的VRs。为此,将18种独特AAV衣壳的VP结构进行叠加,以识别每个VR的第一个和最后一个氨基酸,其中至少有一个衣壳在环结构内其Cα氨基酸位置出现≥1埃的差异。与之前一样,只考虑具有这种差异的超过两个连续氨基酸的片段为VRs。由于现在可用的AAV结构数量更多,VR的氨基酸范围比之前的描述有所扩大。VRs是VP3序列中在衣壳内表现出最高氨基酸多样性的片段,是它们细胞和组织趋向性以及不同抗原特性的决定因素。然而,氨基酸差异并非均匀分布。一些表面环,如VR-II、III和HI环,更为保守,而其他环,如VR-IV和VR-VIII,则高度可变。此外,AAV之间环长度的变化导致了VRs的结构异质性,而相同长度的环往往具有更相似的环构象。最显著的结构变异通常出现在VRs的顶端。然而,一些VRs,如VR-IV、V和IX,并不只有一个顶点,而是由两个子环组成。在所分析的衣壳中,AAV5与其他AAV的氨基酸差异最大,这通常导致独特的环构象。此外,还观察到进化枝特异性的环构象。最后,对每个环的平均氨基酸组成分析表明,VR-VI具有最多的带电氨基酸,这是由于大多数AAV中存在显著的H-K-D-D-E/D-E/D-K/R序列基序。特别是,这些酸性氨基酸的取代会对AAV载体的转导效率产生负面影响。然而,该区域的确切功能尚不清楚。在某些衣壳中,用中性或酸性氨基酸取代碱性氨基酸已被证明可以增加衣壳稳定性。与VR-VI相比,VR-III环的带电氨基酸最少。关于疏水氨基酸的百分比,各VRs相当,范围在约30%到40%之间。由于暴露于溶剂,表面环中的疏水性受到限制,但表面暴露的疏水残基在衣壳组装、稳定性、聚集、受体相互作用和转导效率中的作用尚未完全表征。

非灵长类AAV的衣壳结构

除了灵长类AAV,还从多种脊椎动物中分离出依赖病毒属的其他几种病毒,包括牛、山羊、猪、海狮、狐狸、蝙蝠、啮齿动物、鸟类和爬行动物。最早发现的两种非灵长类AAV是牛AAV(BAAV)和鹌鹑AAV(QAAV,以前称为禽AAV),分别于20世纪70年代作为牛腺病毒1型污染物和在Olson株鹌鹑支气管炎(一种禽腺病毒)制备物中发现。非灵长类AAV的差异可能像AAV5与其他AAV血清型之间的差异一样大。一个例子是蝙蝠AAV分离株10HB(BtAAV-10HB),其VP1序列与AAV1-AAV13相比,同一性在53%到60%之间。2020年,确定了BtAAV-10HB衣壳的结构,分辨率为3.0埃,这是第一个确定的非灵长类AAV结构。此后,蛇AAV(SAAV)、QAAV、山羊AAV分离株1(AAVgo.1)、鹅细小病毒(GPV)以及猪分离株1和6(AAVpo.1和AAVpo.6)的衣壳也已被结构表征。与依赖病毒属的其他成员一样,这些病毒是非致病性的,但GPV除外,它被认为是水禽德兹西病的病原体。不同非灵长类AAV的VP1氨基酸序列同一性与AAV2和AAV5相比在47%到94%之间。总体而言,非灵长类AAV的衣壳结构显示出所有AAV和细小病毒共有的保守特征,包括5重对称轴处的通道、2重对称轴处的凹陷以及3重对称轴周围的突起。目前分析的衣壳大多具有更圆润(类似AAV5)的3重突起,这可能是由于它们较短的VR-IV环。与灵长类AAV类似,VP结构显示出高度的重叠,衣壳核心几乎相同,结构变异性主要出现在表面环。
非灵长类AAV正在被研究作为基因治疗应用的替代载体,因为普通人群中存在的预存抗体使得一些患者无法参加AAV临床试验。目前,所有获批的AAV疗法都源于灵长类AAV。据推测,不在人类或灵长类群体中传播的AAV可以规避人类预存抗体。然而,最近对人类血清的研究表明存在高水平的交叉反应性,约25%-35%的人类血清面板能识别SAAV或QAAV。在大多数情况下,识别这些AAV的血清也与大多数AAV血清型发生交叉反应,表明衣壳的高度保守的5重区域是原因所在。类似地,从Zolgensma接受者获得的一组人类单克隆抗体显示,靶向5重对称轴的抗体与几种非灵长类AAV衣壳发生交叉反应。虽然这些病毒中的一些天然能够转导人类细胞或组织,但其他病毒(例如QAAV)则不能。然而,将VP1u区域与AAV8交换的工程化QAAV衣壳恢复了在人类细胞中的转导。这种策略也适用于SAAV和胡须龙细小病毒(BDPV)的衣壳。总体而言,非灵长类AAV的研究不足,只有一小部分依赖病毒被研究。

衣壳相互作用的定位

AAV载体的广泛使用面临的最重大障碍之一是大量健康个体中存在预存中和抗体(NAbs)。这些抗体来源于先前感染自然传播的AAV。靶向衣壳的抗体可以使载体失活,导致治疗效果丧失。因此,带有NAbs和/或超过定义抗体滴度阈值的患者被排除在接受AAV治疗之外。规避这些预存NAbs的一种策略是设计能够逃逸这种免疫反应的AAV衣壳。在cryo-EM的“分辨率革命”之前,小鼠单克隆抗体的结合位点被定位到AAV1、AAV2、AAV4、AAV5、AAV6、AAV8、AAV9和AAVrh.10的衣壳上,分辨率范围约为5到20埃。在这些分辨率下,将先前确定的高分辨率衣壳和抗体模型拟合到较低分辨率图谱中,以确定所分析抗体的衣壳表位中潜在的氨基酸候选列表。cryo-EM技术的改进使得能够高分辨率地直接识别衣壳表面上与抗体抗原结合片段(Fab)的互补决定区(CDRs)相互作用的接触氨基酸。第一个高分辨率AAV-抗体复合物结构是AAV5与小鼠单克隆抗体HL2476的结构,该抗体结合到衣壳的3重突起。最近,确定了来自三名接受Zolgensma生物制剂的患者的一组21种人类单克隆抗体与AAV9衣壳结合的复合物结构。在这21种复合物结构中,绝大多数(>75%)的抗体结合在衣壳的2重区域附近,两种抗体分别结合3重和5重区域,另一种结合2/5-fold壁。从这些结构中观察到的另一个现象是,结合在衣壳对称轴处或附近的配体无法通过在3D图像重构过程中应用全局二十面体对称性来解析。相反,需要对感兴趣区域进行局部亚颗粒重构才能在不“模糊”的情况下解析配体。这些抗体的界面面积范围在约1000到2000埃2之间(平均约1500埃2)。
类似于人类或鼠源抗体的Fabs,单链骆驼VH域抗体(也称为纳米抗体)与AAV衣壳的结合也已被定位。这些纳米抗体的大小仅为标准IgG的Fab片段的四分之一左右,用于亲和层析纯化方案,实现可扩展的“良好生产规范”(GMP)级AAV载体纯化。最常用的纳米抗体AVB和AAVX能够纯化多种AAV衣壳。它们的结合位点已高分辨率地定位到AAV8衣壳(AVB:2.7埃,AAVX2.3
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号