泰国人类测序数据中多样化环状病毒(Anellovirus)的发现及其分类学挑战

【字体: 时间:2025年09月05日 来源:Microbiology Spectrum 3.8

编辑推荐:

  这篇研究通过挖掘泰国人类全基因组测序数据,首次系统鉴定了434条部分序列和77条完整环状病毒(Anellovirus)基因组,涵盖7个属(包括4个泰国新记录属),并发现33个潜在新物种。研究揭示了泰国环状病毒的高度多样性及其跨国传播特征,同时指出当前基于69% orf1序列相似性的分类方案与进化关系存在不一致性,为病毒分类学提供了重要修正依据。

  

泰国人类测序数据中环状病毒的多样性发现

ABSTRACT

环状病毒(Anellovirus)是人类正常病毒群落的重要组成部分,但泰国地区的病毒多样性长期缺乏系统研究。本研究通过分析1,175份泰国人全基因组测序数据,首次从149份样本(12.68%)中鉴定出434条部分序列和77条完整基因组,这些病毒具有末端冗余、完整orf1基因和保守非翻译区(UTR)等特征。

INTRODUCTION

环状病毒是一类单链DNA病毒,基因组大小约2-4千碱基,包含3-5个开放阅读框(ORF)。国际病毒分类委员会(ICTV)目前已承认34个属和173个物种。尽管全球多国已开展相关研究,但泰国自1999年首次报道后,相关数据仍局限于PCR检测或短序列分析,缺乏完整基因组信息。

MATERIALS AND METHODS

研究采用Entourage流程分析非人源测序数据:

  1. 1.

    使用fastp和MEGAHIT进行数据清洗和组装

  2. 2.

    通过MMseqs2比对和CheckV评估病毒序列完整性

  3. 3.

    构建包含19,325条orf1序列的参考数据库

  4. 4.

    采用69%相似性阈值进行物种分类网络分析

  5. 5.

    使用MAFFT和IQ-TREE2进行系统发育重建

RESULTS

1. 泰国人群普遍携带环状病毒

在12.68%的样本中检测到病毒序列,包括27个Alphatorquevirus、44个Betatorquevirus、3个Gammatorquevirus和3个Hetorquevirus完整基因组。值得注意的是,Hetorquevirus、Lamedtorquevirus、Samektorquevirus和Yodtorquevirus属为泰国首次报道。

2. 分类学与进化分析

序列相似性网络分析发现:

  • 32条序列属于13个已知物种

  • 55条序列可能代表33个新物种,其中一对Betatorquevirus序列与数据库最近似序列仅64%相似性

  • 24名个体携带来自不同进化支的多重感染毒株

3. 跨国传播特征

概率Jaccard指数(JP)显示泰国病毒谱与瑞士(JP=0.4115)、中国(0.3641)相似度最高,而与地理邻近的马来西亚(0.0411)差异显著,提示传播路径复杂。

4. 分类学挑战

研究发现:

  • 6个属中存在严格/宽松簇混合现象

  • 当序列比对存在≥7.75%空位时,相似性计算差异达4.48%

  • 部分Betatorquevirus和Gammatorquevirus进化支与相似性分类结果冲突

DISCUSSION

研究首次系统揭示了泰国环状病毒的"隐藏多样性",证实人类基因组数据可作为病毒发现资源。值得注意的是:

  1. 1.

    当前69% orf1相似性阈值在空位较多时可能导致分类偏差

  2. 2.

    病毒谱地理分布与进化历史不完全匹配

  3. 3.

    多重感染现象普遍(39.34%样本)

研究建议未来结合长读长测序技术完善基因组组装,并开发整合进化关系的分类框架。这些发现为理解环状病毒的全球传播动力学和宿主适应性提供了新视角。

Box 1. 空位对相似性计算的数学影响

公式推导显示,当比对空位比例(G)为10%时,相似性上下界差值(D)可达S?×(G/1-G)。例如S?=0.8时,dD/dG达0.99,表明空位会指数级放大相似性计算差异。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号