
-
生物通官微
陪你抓住生命科技
跳动的脉搏
牛支原体亚种疫苗候选靶点的多样性及T细胞抗原潜力解析:核心基因组与MHC表位预测揭示新型重组蛋白疫苗开发路径
【字体: 大 中 小 】 时间:2025年09月12日 来源:Genome 1.7
编辑推荐:
本综述系统分析了牛支原体亚种(Mycoplasma mycoides subsp. mycoides, Mmm)疫苗候选靶点的基因组多样性及T细胞抗原潜力。研究基于15株Mmm非冗余全基因组序列,鉴定出包含806个基因的93%核心基因组,其中86个为外膜/分泌蛋白编码基因。尽管序列高度保守(平均相似度99.6%),这些蛋白在牛主要组织相容性复合体(MHC)I类和II类表位数量及结合强度方面存在显著差异。研究特别突出了异亮氨酸-tRNA连接酶、P115样蛋白及含PDxFFG模体的假设蛋白等靶点,其富含MHC表位热点,为开发安全高效的重组蛋白疫苗(针对传染性牛胸膜肺炎CBPP)提供了关键理论依据。
牛支原体亚种(Mycoplasma mycoides subsp. mycoides, Mmm)是传染性牛胸膜肺炎(Contagious Bovine Pleuropneumonia, CBPP)的病原体,该疾病主要影响撒哈拉以南非洲地区的牛群,可造成重大经济损失。当前急需开发有效疫苗以控制CBPP。为此,研究利用公开的15株牛源Mmm非冗余全基因组序列,鉴定出一个包含806个基因的93%核心基因组,其中包含208个外膜和胞外蛋白编码基因中的86个。尽管这些蛋白在序列水平高度保守(包括与牛主要组织相容性复合体MHC I类和II类分子预测表位结合位点),但多个蛋白在MHC I类和II类表位数量及预测结合强度方面存在显著差异。这些结果突出了若干有前景的靶点,支持开发针对CBPP的新型重组蛋白疫苗。
CBPP起源于中北欧,并在欧洲扩张期间传播至世界其他地区。尽管许多国家已消灭CBPP,但其在撒哈拉以南非洲国家仍是主要疾病,造成重大经济损失。由于全球牲畜及动物产品流动,CBPP对无CBPP国家也构成威胁,被列入2024年美国国家动物健康报告系统(NAHRS)应报告疾病清单和世界动物卫生组织陆生动物卫生法典。CBPP由Mmm引起,Mmm是牛支原体簇(Mycoplasma mycoides cluster)成员,该簇包含五种反刍动物病原体。最严重的病原体是Mmm和山羊支原体亚种(Mycoplasma capricolum subsp. capripneumoniae),后者引致传染性山羊胸膜肺炎(CCPP)。其余三种簇成员(Mycoplasma mycoides subsp. capri, Mycoplasma capricolum subsp. capricolum, Mycoplasma leachii)可共同引起小反刍动物的关节炎、乳腺炎、角结膜炎、败血症和肺炎。
CBPP通过包括疫苗接种、移动控制和扑杀措施在内的控制手段已从欧洲、北美和澳大利亚消除。然而,在许多存在CBPP的撒哈拉以南非洲国家,实施移动控制和扑杀措施存在问题。因此,迫切需要有效疫苗及加强疫苗接种和监测规划以帮助控制非洲CBPP。当前两种控制CBPP的疫苗均为减毒活Mmm:T1/44(自1956年使用)和T1sr(链霉素耐药变体)。然而,T1/44存在炎症并发症且减毒不完全,T1/44和T1sr在效力和保护持续时间方面均存在局限性。其他Mmm疫苗,包括皂苷灭活、热灭活或福尔马林固定疫苗,在牛中显示出对Mmm的可变保护性免疫反应,并未广泛用于疫苗接种运动。重组Mmm蛋白疫苗已显示出对CBPP的一些保护作用,尽管某些重组体可能对宿主有害,如脂蛋白LppQ的N末端导致免疫相关病理增加。因此,需要更安全、更有效且符合当前动物福利标准生产的新一代Mmm疫苗。
截至2024年10月1日,NCBI数据库中有15个Mmm组装基因组,不包括同一菌株不同传代点的冗余基因组。这些基因组代表20世纪或21世纪从欧洲、非洲、亚洲和澳大利亚分离的菌株。这些菌株很可能都在过去300年内从一个欧洲祖先演化而来。尽管是一个小集合,但这些基因组可用于Mmm的初步评估,包括:(1)保守核心基因组,(2)外膜和/或分泌蛋白的多样性,以及(3)蛋白内主要组织相容性复合体(MHC)I类和II类热点识别。由于Mmm具有细胞内和细胞外感染阶段,两种T细胞表位都可能与CBPP有深刻关联。为此,我们鉴定了可用Mmm基因组的核心,并表征了86种已知位于Mmm外膜或分泌、或先前因免疫保护测试而感兴趣的疫苗候选蛋白的蛋白多样性和T细胞表位。
本项目未涉及人类或动物参与者或标本收集。所有15个公开可用的非冗余Mmm基因组均从GenBank下载。使用DFAST(v1.2.17)重新注释基因组,以确保在GenBank中存入和在不同时间原始注释的基因组之间注释一致性。使用EDGAR(v3.2)进行泛基因组分析,以模式菌株PG1的基因组作为参考序列(GCA_000011445.1)。从泛基因组分析中鉴定出93%核心基因组,允许包含数据集中单个基因组缺失的基因,并最大限度地减少因基因组组装contig间分裂而人为排除的基因。
文献检索确定了具有实验证据和/或预测位于外膜或由Mmm或相关物种分泌的蛋白。那些由核心Mmm基因组中包含的基因编码的蛋白被提交至netMHCpan-4.1和netMHCIIpan-4.3,分别寻找预测的I类和II类MHC表位序列。NetMHCpan-4.1在100个牛MHC-1等位基因上运行,肽段长度为8、9、10和11,其他设置默认。NetMHCIIpan-4.3以默认设置在365个牛MHC-2等位基因上运行。表位命中按牛亚种(Bos taurus taurus, B. taurus 和 Bos taurus indicus, B. indicus)分类,另外在信息可用时按特定品种分类。用于从EDGAR核心和泛基因组输出中提取氨基酸序列的Python脚本可在https://github.com/EmilyWynn/EDGAR-protein-grabber找到。
从15个Mmm基因组中鉴定出包含1589个基因的泛基因组和包含806个基因的93%核心基因组。排除由于其作为重组疫苗抗原的已知并发症而除外的LppQ,核心包括从文献中鉴定出的208个编码外膜和/或胞外蛋白的基因中的86个;这意味着在群体水平上可能有效的疫苗靶点大幅减少。尽管菌株地理起源不同且分离时间范围超过80年,代表86个靶基因的蛋白变体的序列相似性范围从95.2%到100%,平均最小序列相似性为99.6%。外膜和分泌蛋白的高度保守性在相关物种(如牛支原体Mycoplasmopsis bovis,原Mycoplasma bovis)的群体水平中已被观察到。然而,对于Mmm,保守的DNA序列不一定转化为保守的蛋白序列,因为支原体物种可通过编辑缺陷的氨酰-tRNA合成酶引入蛋白序列变化,而DNA水平不反映。这是一种抗免疫球蛋白防御策略,可能部分解释了本研究中Mmm基因组间观察到的高序列保守性。
T细胞介导的免疫对保护 against 具有细胞内和细胞外阶段的病原体至关重要。随着抗原呈递细胞分别显示MHC I类和II类分子激活CD8和CD4 T细胞,识别两种MHC类别的表位并了解目标牛群中的等位基因分布非常重要。现存牛主要有两种类型:Bos taurus 和 Bos indicus。代表两者的品种均在非洲;然而,Bos indicus 牛更适合炎热干燥的条件,并且占多数。NetMHCpan-4.1数据库中有100种不同的牛MHC I类等位基因,其中70种在Bos taurus牛中观察到,6种在Bos indicus牛中观察到,24种在Bos taurus/Bos indicus杂交品种中观察到。在所有100个等位基因中,由核心基因组保留基因编码的86个外膜和/或分泌蛋白的表位位点范围从74到99个等位基因。在netMHCIIpan-4.3数据库的365种不同牛MHC II类等位基因中,93种在Bos taurus牛中观察到,232种在Bos indicus牛中观察到,40种在Bos taurus/Bos indicus杂交品种中观察到。在所有365个等位基因中,86个蛋白的表位位点范围从15到352个等位基因。每个等位基因每个蛋白变体的预测MHC I类和II类表位位点平均数量范围分别为2.2–53.9和0.1–40.6,表明蛋白间潜在抗原性范围广泛。
由核心基因编码的86个外膜和/或胞外蛋白中有3个具有20个或更多平均预测MHC I类和II类表位位点(每个等位基因每个蛋白变体),一个假设的跨膜蛋白(含Secreted Thousand Residue Frequently Tandem motif)刚好低于截止值(MSC_0032)。第一个是异亮氨酸-tRNA连接酶(表1,MSC_0585),也称为异亮氨酰-tRNA合成酶。该蛋白将异亮氨酸连接到其相应的tRNA上,因此受到缺陷编辑的抗免疫球蛋白防御策略的影响。异亮氨酸-tRNA连接酶是一种胞质蛋白,经历非经典分泌。
第二个蛋白是含结构维持染色体(SMC_C)模体的P115样蛋白(表1,MSC_0476)。该蛋白也位于细胞质中,参与细菌染色体浓缩和分区,并具有未定义的分泌方法。支原体物种将胞质蛋白运输至其外表面作为另一种避免免疫识别的策略并不罕见。在外表面,这些蛋白可作为粘附素并用地宿主成分包裹细菌。
第三个蛋白是含PDxFFG模体的假设蛋白(表1,MSC_0963),该模体存在于具有信号肽的蛋白的N末端域中。该假设蛋白具有表1所列所有蛋白中最多的蛋白变体数量(N=6),这表明它可能比其他蛋白面临更高的选择压力以发生变化。此外,与异亮氨酸-tRNA连接酶和P115样蛋白相比,其MHC I类和II类表位热点分布更广泛,表明该蛋白的T细胞识别广泛。
核心基因组还包含编码延伸因子热不稳定(EF-Tu)和热休克蛋白70(HSP70或DnaK)的基因,这两种都是兼职蛋白,在包括支原体物种在内的多种细菌的重组疫苗中显示出潜力。EF-Tu的主要功能是催化氨酰-tRNA与核糖体A位点的结合,但它也作为粘附素兼职,在某些情况下可促进细胞侵袭。EF-Tu是原核生物中最丰富和高度保守的蛋白之一。在本研究检查的15个基因组中,编码的EF-Tu蛋白完全保守,无氨基酸替换。EF-Tu序列具有分层的MHC I类和II类表位热点区,两者在蛋白C端侧更丰富。HSP70具有三种不同的蛋白变体,最小相似性为99.83,每个变体相差一个氨基酸替换。它还具有分层的MHC I类和II类表位热点区,这可能有利于包含在重组蛋白设计中。
在设计将在田间具有最大保护效力的疫苗时,考虑宿主及其病原体的群体水平多样性非常重要。在宿主方面,更深入地了解Bos indicus牛MHC I类等位基因多样性将有助于设计重组蛋白,为撒哈拉以南非洲约180个牛品种提供保护。在病原体方面,由于本研究仅使用公共领域可用的15个Mmm基因组,此处报告的核心和泛基因组不太可能代表Mmm遗传多样性的完整图景;需要跨时间和空间对菌株进行额外的全基因组测序。然而,很明显,从不同国家不同年代分离的菌株之间保持了高度的序列相似性。因此,可用基因组中存在可能适用于重组疫苗的蛋白靶点的线索。为此,所有86个由核心基因编码的外膜和/或胞外蛋白的变体序列均在文件夹S1和S2中提供,并带有MHC I类和II类表位注释。这些数据集可能进一步有助于设计包含已知MHC I类和II类表位的重组蛋白或多肽。
使用产品和公司名称对于准确报告方法和结果是必要的;然而,USDA不保证或担保产品的标准,USDA使用名称并不意味着认可该产品而排除其他可能也适用的产品。USDA是一个平等机会的提供者和雇主。
生物通微信公众号
知名企业招聘