《Vaccines》:Hybrid Whole-Genome Sequencing for Genetic Stability Assessment of Infectious Laryngotracheitis Virus Vaccine Strains
Hee-young Jeong,
Jessica Hicks,
Su-min Go,
Jin-ju Nah and
Il Jang
编辑推荐:
本研究采用混合全基因组测序策略,成功组装了传染性喉气管炎病毒(ILTV)Serva和Salsbury #146商品化疫苗株的高质量基因组,揭示了基因组倒位等结构变异。基于核心基因组的泛基因组分析有效解析了疫苗株的系统发育谱系。该工作建立了一个融合长读长和短读长测序的可靠工作流程,为复杂疱疹病毒疫苗的基因组质量控制和遗传稳定性评估提供了有力的方法论框架。
1. 引言
传染性喉气管炎是一种由传染性喉气管炎病毒(ILTV,即鸡α疱疹病毒1型)引起的高传染性鸡呼吸道疾病,对全球家禽业构成重大威胁。该病以高发病率和高死亡率为特征,其临床特征与其他呼吸道感染相似,使得早期诊断和疫情控制复杂化。疫苗接种是控制传染性喉气管炎的主要手段,主要使用鸡胚源(CEO)和组织培养源(TCO)两种减毒活疫苗。然而,在传代和田间流行过程中累积的遗传变化可能影响疫苗效能,因此需要对疫苗株的基因组特征和遗传稳定性有更深入的了解,以确保持续的有效性。
在韩国,为确保疫苗质量和安全,采用了种子批系统和遗传稳定性概念。遗传稳定性要求疫苗株的基因组序列在传代过程中保持一致,监管评估通常比较原始种子与最高允许传代代次的基因组。本研究选择了两款在韩国销售的商业减毒活疫苗:Salsbury #146 和 Serva。
对许多禽类病毒的评估依赖于对有限数量的抗原性相关标记基因(如传染性支气管炎病毒的S1基因或新城疫病毒的F基因)进行测序。与这些病毒不同,ILTV拥有一个约150千碱基对(kb)的相对较大的双链DNA基因组。尽管多项研究已探索了可能与毒力减毒相关的候选基因座,但尚未形成一套能够跨谱系和生产历史、一致区分疫苗株与强毒田间分离株的、普遍接受的关键氨基酸替换标准组合。鉴于其多基因和背景依赖的遗传基础,使用单个代表性基因座或一小部分标记来评估ILTV疫苗稳定性存在固有局限性。因此,全基因组测序提供了更合适的框架,以捕获全基因组变异,并支持在遗传稳定性评估中对疫苗种子批进行高分辨率比较。
除了多基因决定因素外,ILTV基因组还表现出显著的结构复杂性,限制了从部分、基于基因座的测序中可以推断的信息。其基因组排列为TRL–UL–IRL–IRS–US–TRS构型,其中独特短区(US)两侧是内部重复短区(IRS)和末端重复短区(TRS)。这些重复序列促进同源重组,可导致US区域发生倒位,产生多种基因组异构体。此类重排可独立于点突变发生,并且仅从选定位点无法检测,可能导致关于遗传稳定性的结论不完整或具有误导性。ILTV基因组的这些特性共同凸显了全基因组测序对可靠评估疫苗株稳定性的必要性。
2. 材料与方法
本研究使用了来自不同制造商的两款商用减毒活ILTV疫苗株:Serva和Salsbury #146。采用杂交策略进行全基因组测序,结合了牛津纳米孔技术(ONT)的长读长和Illumina的短读长。通过修改的自动化提取方案从疫苗样品中提取病毒DNA。Illumina测序在NovaSeq X Plus平台上进行,生成2×150碱基对(bp)的双端读长。ONT测序则使用MinION设备和R10.4.1流通池,通过Dorado进行碱基识别。
基因组组装流程包括:使用FastQC和Trimmomatic对Illumina读长进行质量控制和修剪;使用Kraken2过滤掉宿主来源的读长;对ONT读长进行碱基识别、分类和过滤(使用Filtlong,最小读长为5 kb,以改善组装质量);使用Canu对过滤后的ONT读长进行从头组装;使用Pilon结合过滤后的Illumina读长对组装结果进行三轮迭代抛光。组装质量通过QUAST进行评估,并使用Sanger测序对与参考基因组存在差异的位点进行验证。
为表征基因含量变异并识别ILTV毒株间的保守基因,使用Panaroo进行了泛基因组分析。首先使用Prokka为所有ILTV基因组生成统一的GFF注释文件。随后使用Panaroo对≥95%菌株中存在的基因(核心+软核心基因)进行聚类,生成核心基因组比对,用于下游系统发育推断。使用RAxML-NG在GTR+GAMMA替换模型下进行最大似然系统发育分析,并利用iTOL对系统发育树进行可视化和注释。
3. 结果
3.1. 测序与基因组组装统计
通过混合测序策略,成功为两个ILTV疫苗株生成了单个重叠群的完整基因组组装。组装后的基因组长度、GC含量、平均测序覆盖度等统计信息表明获得了高质量的基因组序列。经过Pilon三轮抛光后,碱基水平的准确性得到提高。与相应参考基因组相比,Serva组装存在10个单核苷酸多态性(SNP),Salsbury组装存在2个SNP,其中大部分位于同聚物束内或附近。
3.2. 序列变异与结构重排的Sanger验证
组装完成后,通过Sanger测序验证了组装序列的准确性。对于Serva株,所有43个经过验证的基因座均与从头组装的序列完全一致。对于Salsbury #146株,在验证的位点上也显示出100%的一致性,且其从头组装序列与参考基因组(KP677882.1)的一致性低于Sanger验证结果。
在Salsbury #146株中,鉴定出位于IRS和TRS重复序列侧翼的US区域内发生了一个结构倒位。KP677882.1参考基因组代表一种取向,而从头组装(PX499072)显示出相反的取向。跨越两个倒位连接处的Sanger测序结果与从头组装序列相匹配,而与参考序列取向不同,这验证了US区域倒位的存在,并支持了混合组装的结构准确性。
3.3. 泛基因组分析
泛基因组分析共鉴定出153个基因。根据在菌株中的存在频率,将其分类为核心基因(存在于99-100%菌株中)、软核心基因(存在于95-<99%菌株中)、壳基因(存在于15-<95%菌株中)和云基因(存在于<15%菌株中)。为进行下游系统发育推断,构建了基于存在于≥95%菌株中(核心+软核心,共103个)基因的核心基因组比对。
3.4. 基于核心基因组的系统发育分析
基于核心基因组的系统发育分析能够清晰地对ILTV毒株进行聚类,并可靠地推断主要疫苗衍生谱系间的亲缘关系。最大似然分析将毒株分为五个与所报道疫苗起源一致的主要类群。Serva相关毒株(包括从头组装的Serva基因组)形成了一个得到良好支持的Serva分支。Salsbury #146组装序列与其它Salsbury衍生的商业毒株聚集在Salsbury组内。其它疫苗相关谱系(如TRVX、SA2和IVAX相关毒株)也被解析为不同的、非重叠的群体。核心基因组方法可能减少了由US区域结构变异引起的拓扑学误差,为疫苗衍生ILTV谱系的基因组学分类和监测提供了可靠框架。
4. 讨论
自减毒活ILTV疫苗问世以来,疫苗接种策略已显著降低了传染性喉气管炎的全球负担。然而,与疫苗病毒间重组相关的更强毒力毒株的出现凸显了持续监测和稳健遗传稳定性评估的必要性。由于ILTV尚未建立跨疫苗谱系和田间分离株的、公认的标准化减毒标记组合,仅基于标记物的稳定性评估存在局限性,支持采用全基因组方法。
先前的研究主要依赖短读长测序平台,这反映了早期长读长测序技术的局限性。仅依赖短读长数据本身对ILTV进行从头组装面临挑战,特别是重复的、几乎相同的区域可能导致支架构建失败和组装碎片化。为应对这些限制,本研究采用了整合ONT长读长和Illumina短读长的混合组装策略。ONT读长改善了组装的连续性,而Illumina读长则通过碱基水平抛光提高了准确性。值得注意的是,ILTV基因组的内部长重复区域跨度约13.8 kb,因此选择大于5 kb的长读长旨在通过提高获得跨越重复相关区域读长的可能性来改善结构解析。
经过Pilon抛光后,初始ONT衍生重叠群与最终抛光后组装之间的单核苷酸差异数量很少,这表明ONT数据本身可能足以满足一些对残余碱基水平错误不太敏感的应用。然而,由于诸如疫苗遗传稳定性评估等下游应用需要极高的准确性以检测传代过程中的细微变化,因此保留了混合工作流程以生成适用于纵向比较的高置信度参考组装。从实用的质量控制视角看,当有Illumina抛光可用时,增加ONT测序深度超过获得完整长读长组装所需的水平,其回报是递减的。
为评估组装准确性,将本研究得到的从头组装基因组与先前发表的相同疫苗株参考序列进行了比较。在验证位点进行的Sanger测序结果与从头组装序列相符,支持了混合工作流程的准确性。与已发表参考序列的差异可能反映了商品化疫苗批次间的变异和/或不同测序和组装方法间的技术差异。值得注意的是,在Sanger测序图谱的特定基因座观察到了混合碱基信号。这种混合碱基信号在之前对ILTV疫苗和田间毒株的分析中也有报道,表明该特征并非所检测毒株独有。虽然其生物学基础尚待确定,但此类信号可能反映了批次内的异质性、共循环的亚群、或扩增和测序产生的技术假象。从质量控制的角度看,这些混合碱基信号可能表明小瓶/批次内存在亚一致性水平的多样性。
对于Salsbury #146毒株,观察到其US区域的取向与已发表的参考序列存在差异,这与疱疹病毒基因组的异构化以及先前对ILTV的预期一致。尽管US区域倒位可能混淆全基因组比对并偏倚系统发育推断,但一些研究仍在存在这种结构变异的情况下依赖全基因组比对。为缓解此问题,本研究采用了基于泛基因组的方法来推导用于系统发育重建的保守核心基因组数据集。利用这个核心基因组比对,文献和GenBank中的毒株被解析为与其所报告的疫苗谱系一致的、不同的进化支,这支持了使用核心基因组策略来比较具有复杂结构变异的ILTV基因组。
5. 结论
总而言之,本研究的混合组装全基因组测序工作流程为所分析的具体商品化ILTV疫苗小瓶产生了高置信度的基因组组装,这些组装包含了复杂的重复序列,并能够检测主要的结构变异。此外,核心基因组系统发育框架提供了一种谱系分配方法,降低了对US区域倒位的敏感性,支持了比较基因组学和疫苗质量控制应用。因此,本研究验证的全基因组测序工作流程和报告的基线组装为未来的比较研究(包括与田间分离株的更广泛比较,以及在可获得的情况下与表型数据的整合)提供了一个有用的框架,以更好地完善与减毒相关的基因组特征。