孟加拉国LSDV分离株的全基因组表征:串联重复序列在病毒基因组稳定与适应性中的新见解

《Scientific Reports》:Genome-wide characterization of lumpy skin disease virus isolate from Bangladesh

【字体: 时间:2025年10月17日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对Lumpy Skin Disease Virus (LSDV) 在孟加拉国暴发带来的重大畜牧业威胁,开展了全基因组表征研究。通过下一代测序技术,研究人员系统解析了LSDV分离株的基因组结构、蛋白质编码特征及串联重复序列分布规律。研究发现该病毒基因组高度保守(99.9%一致性),鉴定出156个独特蛋白编码序列,其中71.8%为可溶性蛋白。特别值得注意的是,串联重复序列分析揭示了其与基因的紧密空间关联(100%位于基因1kb范围内)和2:1的取向偏好性,表明这些重复元件可能参与转录调控。GC含量双峰分布(峰值0.05%和0.3%)和强相关性(r=0.999)进一步证实重复序列的非随机分布特性。这些发现为理解LSDV基因组进化机制和开发新型防控策略提供了重要理论依据。

  
在当今全球畜牧业面临的重要挑战中,Lumpy Skin Disease Virus (LSDV) 的传播尤为引人关注。这种属于痘病毒科(Poxviridae) 山羊痘病毒属(Capripoxvirus) 的病原体,最初仅限于撒哈拉以南非洲地区,但近年来已迅速扩散至中东、亚洲部分地区和欧洲,成为国际性的动物卫生问题。感染LSDV的牛只会出现发热、结节性皮肤病变、淋巴结肿大等症状,导致产奶量和肉产量显著下降,造成严重经济损失。更令人担忧的是,贸易限制和防控措施的加强进一步放大了该病的经济影响。
面对这一严峻形势,研究人员意识到深入理解LSDV的基因组特征和进化机制对于制定有效防控策略至关重要。LSDV基因组为双链DNA分子,长度约151kbp,具有高A-T核苷酸含量和丰富的重复DNA序列。尽管全基因组研究显示该病毒序列高度保守,但点突变和结构变异仍促进了病毒进化和宿主适应性。特别是在新兴重组株出现的地区,通过比较基因组学和系统发育分析来解析LSDV的遗传结构,对于疫苗开发和疫情管理具有关键意义。
在这一背景下,Md Bashir Uddin等研究人员在《Scientific Reports》上发表了题为"Genome-wide characterization of lumpy skin disease virus isolate from Bangladesh"的研究论文,对孟加拉国暴发中分离的LSDV进行了全面基因组分析。
研究团队采用了一系列关键技术方法开展此项工作。他们从孟加拉国不同地区采集了表现LSD典型临床症状的牛只样本,包括结节性皮肤病变和结痂。通过优化后的酚-氯仿 protocol (协议) 提取高质量病毒DNA,使用Illumina NovaSeq 6000平台进行测序,获得>100x基因组覆盖度的数据。基因组组装采用SPAdes v3.15.3进行de novo (从头) 组装,并使用Mauve和BLASTn进行参考基因组引导的scaffolding (支架构建)。基因预测和功能注释通过Prokka v1.14.6完成,同时利用ViPTree构建蛋白组系统发育树。串联重复序列鉴定使用Tandem Repeats Finder (TRF) v4.09,蛋白特征分析则整合了SOSUI、IPC2.0和ProtParam等多种生物信息学工具。
基因组测序与质量
测序产生的LSDV基因组数据质量较高,表现为全基因组一致性覆盖。序列比对矩阵准确显示了reads (读段) 的比对情况和其他变异,均匀的高base call (碱基识别) 质量分数为下游系统发育和重复序列特征分析提供了可靠基础。
基因组组织与基因注释
注释后的LSDV基因组(GenBank登录号:PP979138.1)显示了分布良好的基因,通过转录方向标记,为了解复制、免疫逃逸和宿主相互作用提供了见解。环形图谱可视化展示了基因组的结构组织,有助于识别功能簇和重组热点。
分类学归属
通过ViPTree构建的蛋白组系统发育树显示了LSDV毒株之间的明显聚类模式,突出了物种内的遗传分化。SAUVM-78(登录号:PP979138.1)被明确归类于痘病毒科(Poxviridae) 脊椎动物痘病毒亚科(Chordopoxyirinae) 的山羊痘病毒属(Capripoxvirus),确认为Lumpy skin disease virus。
蛋白质鉴定
在孟加拉国LSDV分离株的8个完整基因组中,共鉴定出1,113个蛋白编码序列,经过95%序列一致性聚类后,获得156个独特蛋白序列。这一结果表明孟加拉国LSDV毒株蛋白序列存在高度保守性,同时也有一定程度的遗传多样性。
蛋白质表征
可溶性与膜蛋白分布上,SOSUI工具将156个蛋白分类为112个(71.8%)可溶性蛋白和44个(28.2%)膜相关蛋白。其中30个蛋白含有单次跨膜螺旋,8个含有双次跨膜螺旋,3个含有三次跨膜螺旋。
理化性质分析显示,蛋白质分子量范围11.6-27.4kDa,平均约17.2kDa。所有蛋白质的等电点(pI) 均为7.0,表明在生理pH条件下呈中性电荷。脂肪族指数范围24.0-53.0,平均33.4,显示中等程度的脂肪族氨基酸富集。GRAVY (亲水性总平均值) 指数范围-0.914至+0.873,平均约0.19,表明整体倾向于亲水性行为。
信号肽和跨膜结构域预测发现仅有10个蛋白含有信号肽,提示它们可能参与分泌途径或膜定位。功能域分析通过HMMER查询Pfam和NCBI CDD (保守域数据库) 数据库,鉴定出180种不同类型的结构域,包括痘病毒Bcl-2样蛋白、白细胞介素等。
蛋白质系统发育分析
对156个独特LSDV蛋白序列进行聚类分析(90%序列一致性阈值),形成了155个不同的簇,其中大多数为单例簇,表明预测的病毒蛋白产物之间存在高度的序列多样性,反映了进化分歧、毒株特异性适应或不同功能类别病毒蛋白的选择压力。
进化关系
系统发育分析显示孟加拉国毒株与参考毒株、疫苗株和重组株具有密切的遗传关系,靠近Neethling和肯尼亚绵羊山羊痘疫苗株聚类。较小的基因组变异主要位于非编码区,表明不同毒株间编码序列高度保守。
基因组变异
序列比对矩阵揭示了多个点突变和小插入/缺失(indels) 分布在整个基因组的编码和非编码区。这些基因组变异导致了毒株特异性多态性,可能构成孟加拉国分离株与其他参考毒株之间功能差异的基础。
同线性模式
LSDV基因组的同线性(isochore) 模式显示GC含量存在显著异质性,范围在20%-35%之间,这是痘病毒中常见的AT富含基因组的特征。几个局部区域显示出明显的GC富含峰,特别是在末端基因组末端和基因密集区域附近。
串联重复分析
串联重复序列大小从6到87个碱基对不等,拷贝数范围2-8.2,表明某些重复比其他重复更普遍。熵值通常较高(>1.5),表明序列复杂。大多数重复具有较高的匹配百分比(>80%),表明它们保守良好。存在重复簇,例如位置15-21的重复,它们在基因组中彼此靠近。一些重复具有高A-T含量(例如11,15-21),这在病毒基因组中很常见。重复11非常突出,具有非常低的熵(0.39) 和极高的T含量(92%)。
重复大小分布
LSDV基因组中重复大小的分布显示出明显倾向于较短重复的趋势。直方图显示大多数重复的周期大小在10-30个碱基对之间,最高频率出现在15-20bp左右。
拷贝数分布
对LSDV基因组中串联重复拷贝数分布的分析显示,大多数重复以低拷贝数存在,最常见的为每个位点2-3个拷贝。这种偏态分布模式表明基因组对重复扩增的严格调控,可能是为了最大限度地减少基因组不稳定性,同时仍允许一定程度的遗传可塑性。
基因组概览
LSDV的基因组概览呈现了整个约150kb病毒基因组中基因和串联重复分布的视觉图谱。代表注释蛋白编码基因的蓝色条带似乎均匀分布,反映了末端和中心基因组区域相对一致的基因密度。相比之下,代表串联重复的红色条带显示出零星且不均匀的分布,某些基因组位点显示出重复的局部聚类。
重复特征的相关性矩阵
相关性热图揭示了重复特征之间的几个有趣关系:周期大小和一致大小显示出近乎完美的正相关性(0.999462);周期大小和得分具有强正相关性(0.867068),表明较长的重复往往得分更高;拷贝数与周期大小和一致大小均呈现弱负相关性(分别为-0.217333和-0.220953),表明较短的重复可能以较高的拷贝数出现;得分和拷贝数显示出非常弱的正相关性(0.051556)。
重复与基因的邻近性
分析显示,所有重复(比例=1.00)都位于LSDV基因组中基因的1kb范围内。这一显著结果表明重复元件与编码区域之间存在强关联。
重复的GC含量
重复的平均GC含量(0.26%) 与全基因组GC含量(0.26%) 相同。尽管平均值相同,但统计检验显示重复与整体基因组之间的GC含量分布存在高度显著差异(p值≈8.44e-55)。
重复-基因取向
分析显示,在21个重复中,14个与其最近基因的方向相同,7个方向相反。这种2:1的比例表明重复倾向于与基因取向一致。
重复中的常见模体
分析确定了重复中几个高度重复出现的模体。顶级模体(ATTAGGTTTAATTGG及其变体)多次出现,表明强烈的序列保守性。
重复长度与最近基因距离
散点图和相关性分析提供了关于重复和基因之间空间关系的见解。Spearman相关系数为0.069,表明重复长度与最近基因距离之间存在非常弱的正相关关系。
研究结论与讨论
这项针对LSDV基因组的全面全基因组分析揭示了进化结构、蛋白质组分析、基因组组织、基因组稳定性以及串联重复的功能意义之间的复杂关系,为了解重复元件的潜在调控作用及其对病毒适应性的贡献提供了新的视角。
蛋白质组分析结果显示,孟加拉国LSDV分离株的156个独特蛋白序列具有显著的遗传多样性和生化特性。聚类分析确定了155个簇,其中大多数为单例,突出了LSDV蛋白质组内的巨大多样性。理化特性表征显示分子量范围11.6-27.4kDa,统一的pI为7.0,脂肪族指数24.0-53.0,表明中等稳定性。平均GRAVY指数0.19表明倾向于亲水性。HMMER分析确定了180个功能域,包括病毒防御和免疫调节元件,关键蛋白如Poxv_Bcl-2-like和IL10显示出强大的结构域比对。预测了膜相关蛋白和分泌蛋白,其中10个含有信号肽,其他表现出单次或双次跨膜螺旋。系统发育分析证实了高度的序列多样性,加强了LSDV的进化复杂性。
进化分析证实了孟加拉国毒株与疫苗株,特别是Neethling和肯尼亚绵羊山羊痘疫苗株之间的密切遗传关系。编码区的高度保守性表明,尽管非编码区存在微小的基因组变异,当前的疫苗仍然有效。观察到的同线性模式强调了LSDV中基因组组成与功能组织之间的相互作用。这些模式还强调了LSDV平衡基因组稳定性与适应性灵活性的进化策略,这是在变化的宿主环境中生存的关键特征。观察到的异质性可能是基因组紧凑性的一种机制,确保了高适应性和遗传物质的有效利用。
串联重复分析显示的大小变异性(6-87bp)和拷贝数(2-8.2)反映了这些元件在LSDV基因组内的功能多样性。低拷贝数重复的优势表明了一种受控的增殖机制,可能被优化以维持基因组稳定性,同时允许一定程度的遗传变异性。这种平衡对于病毒适应动态的宿主环境和免疫反应至关重要。熵分析突出了这些重复的复杂性,大多数显示出高熵值(>1.5),表明序列多样性和进化适应性。较短重复的优势,特别是那些在10-30bp之间的重复,表明了对紧凑元件的进化偏好,以平衡基因组稳定性与功能灵活性。例外情况,如重复11,具有低熵(0.39) 和极高的T含量(92%),表明在基因组包装或调控中具有特殊作用。
串联重复的空间组织,100%位于编码区域的1kb范围内,强调了它们可能的调控作用。这种邻近性表明这些元件作为顺式调控元件、转录因子结合位点或染色质结构的调节因子。观察到的重复与基因方向一致的2:1取向偏倚进一步支持了它们参与转录促进,可能增强基因表达或促进转录通读。此外,重复内保守的AT富含模体,如ATTAGGTTTAATTGG,突出了它们在转录调控和病毒复制方面的潜力。这些模体可能有助于染色质可及性,促进与宿主转录机制的相互作用并影响病毒复制。
重复特征之间的相关性,包括周期大小和一致大小(r>0.99),强调了控制其功能重要性的内在关系。较长的重复,与较高的保守得分相关,可能在基因组稳定性或病毒适应性中发挥更重要的作用。相反,较短重复的普遍存在,具有较高的拷贝数,表明它们易于进行调控功能和适应多样化宿主环境。
重复的双峰GC含量分布,尽管全基因组平均值为26%,表明可能存在与调控和结构作用相关的不同功能亚类。大约0.05%和0.3%的GC含量峰值表明一些重复可能作为结构元件进化,而其他重复则服务于调控目的。这些发现支持了以下假设:LSDV串联重复不是简单的基因组副产物,而是经历了进化选择以优化其在病毒基因组内的作用。
这些发现表明,LSDV基因组中的串联重复不是随机元件,而是其遗传结构的重要组成部分。它们的保守性、与基因的邻近性以及序列特异性模体表明了它们在基因调控、基因组组织和复制中的作用。重复在功能区域附近的聚类可能将它们定位为进化热点,使病毒能够适应不同的宿主环境,同时保持结构稳定性。
这项研究加强了串联重复在病毒进化中的重要性,支持了它们作为诊断标记物或治疗靶点的潜力。例如,重复内的保守模体可以作为早期检测的生物标记物,或作为破坏病毒复制的分子靶点。然而,需要进一步的研究来阐明它们的确切作用,特别是需要更多LSDV毒株的参与。未来的工作结合病毒培养和体外测定对于将遗传发现与表型结果关联起来至关重要。先进的技术,如CRISPR-Cas9基因组编辑和高分辨率转录组学,可以验证特定重复的功能意义。此外,专注于LSDV重复与宿主细胞机制之间相互作用的实验研究可以发现新的治疗靶点。
总之,LSDV基因组展现了一个紧密组织的结构,在稳定性和功能适应性之间取得了平衡。研究揭示其串联重复高度保守、简短且与编码区域紧密相关,表明在转录和基因组组织中具有调控作用。均匀的基因分布和最少的重复扩增突出了维持基因组稳定性的强大进化约束。重复在基因附近的空间聚类及其保守模体强调了它们的调控重要性。系统发育研究显示孟加拉国毒株之间具有高度的遗传保守性,与疫苗株一致,支持了疫苗效力和病毒进化。重复在基因附近的GC含量和取向偏倚进一步表明了它们的功能意义。这些发现强调了LSDV基因组的进化适应性和紧凑性,为疫苗和治疗开发提供了关键见解。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号