综述:解读隐孢子虫 gp60 基因分型的神秘雷区:指南

【字体: 时间:2025年05月07日 来源:Current Research in Parasitology & Vector-Borne Diseases 2.6

编辑推荐:

  本文聚焦隐孢子虫(Cryptosporidium)的 gp60 基因分型。该基因高度多态,用于种群和流行病学研究,但命名系统复杂易混淆。文章梳理了其分型演化、命名规则,介绍分析工具及资源,为规范 gp60 分型提供全面指导,助力相关研究。

  

隐孢子虫 gp60 基因分型研究进展


隐孢子虫(Cryptosporidium)是一类对全球公共卫生和动物健康具有重要影响的原生动物病原体,能引发人和动物的胃肠道疾病隐孢子虫病。在过去 25 年里,对隐孢子虫的分子流行病学研究高度依赖基于 PCR 的基因分型技术,其中对小亚基 rRNA(SSU rRNA)基因的分析用于确定感染物种,而对编码 60kDa 糖蛋白的高度多态性基因(gp60)的部分测序则用于种内分型。gp60 基因主要在导致人类感染的两种主要物种 —— 人隐孢子虫(C. hominis)和微小隐孢子虫(C. parvum)的分型中发挥重要作用 。

gp60 基因分型的发展及问题


自 2000 年Cryptosporidium gp60基因首次被描述以来,它在隐孢子虫的分型研究中得到了广泛应用,尤其在早期主要聚焦于具有兽医和公共卫生重要性的C. parvumC. hominis。随着研究的深入,越来越多的隐孢子虫物种的 gp60 基因被探索和描述,每个物种都被赋予了 gp60 命名。

最初为C. hominisC. parvum开发的 gp60 分型命名法,通过序列多态性确定了不同的等位基因分组,如C. hominis的 Ia、Ib 等和C. parvum的 IIa、IIb 等 “gp60 家族”。随后,又引入了丝氨酸重复序列的描述,根据 TCA、TCG 或 TCT 密码子的数量进行计数和记录。但在这个过程中出现了诸多问题。

“R” 重复序列在一些 gp60 亚型家族的命名中被使用,但由于其在不同物种和亚型中的序列、位置不同,且命名规则不统一,导致了很多混淆和错误命名。例如,C. parvum IIa 和C. cuniculus Vb 的 R 重复序列位置不同,C. hominis的 Ia 和 If 家族的 R 重复序列不仅基序不同,与丝氨酸微卫星末端的距离也不同。而且,不同研究对 R 重复序列的定义差异也使得亚型命名更加混乱 。

C. parvum家族 IIa 中,还存在一种罕见的 “r” 重复序列,即 ACA 苏氨酸密码子出现在多丝氨酸重复区域内。其位置可变,这也导致了一些命名错误,如 GenBank 中部分记录未遵循正确的命名规则 。

字母后缀在 gp60 命名中用于区分同一亚型的变体,但不同物种和家族的使用规则也不一致。在C. parvum的 IIc 和 IId 亚型家族中,主要基于下游区域的单核苷酸多态性(SNPs)来分配字母后缀;而在C. viatorum中,亚型主要根据重复后区域的 SNPs 进行区分并使用字母后缀;C. mortiferum的后缀使用则更为复杂且不标准化 。

此外,还有 “variant” designation 等不规范的命名方式,因其不具有可量化性和明确性,不建议作为标准命名的一部分。随着C. parvum gp60家族数量的不断增加,拉丁字母命名已达极限,开始采用希腊字母命名新家族,但这也存在与拉丁字母相似易混淆的问题,建议书写希腊字母全称以避免混淆 。

同时,一些不寻常的 gp60 亚型也值得关注。如C. parvum的 IIc 亚型通常具有相同的丝氨酸重复单元,但也有例外;C. hominis虽被认为主要感染人类,但某些亚型也可感染非人类灵长类动物和马属动物等,且具有潜在的人畜共患性 。

不同隐孢子虫物种的 gp60 基因也存在差异。部分物种缺乏典型的丝氨酸微卫星区域,如C. ubiquitumC. felis等,它们的命名方式仅包含物种指定、亚型家族和数字计数。而C. erinacei存在与C. parvum某些亚型家族类似的 ACATCA R 重复序列,C. tyzzeri则有多个 R 重复区域,命名较为困难。C. suis的 gp60 基因不仅丝氨酸重复单元不典型,且基因较长,包含一个长的 21bp 小卫星 R 重复序列,给 PCR 检测和命名都带来了挑战 。

标准化的 gp60 命名法


鉴于 gp60 命名法存在的诸多问题,为避免误解,需要对新发现的亚型命名进行标准化。标准化命名应直观、易于理解,但由于 gp60 基因在不同隐孢子虫物种间和物种内存在多种变异类型,这一过程具有挑战性。目前已总结了不同特征在标准化 gp60 分型命名中的应用,为规范命名提供了参考 。

gp60 研究的分析流程和工具


在对 gp60 基因进行研究时,PCR 检测是重要的一环。由于 gp60 基因高度可变,已开发出多种引物组用于不同隐孢子虫物种的扩增。一些引物组,如 Alves 等人 2003 年发表的引物组,因其广泛的适用性被使用了数十年。但传统的巢式 PCR 存在耗时、成本高和人力需求大等缺点,为此开发了实时 PCR 检测方法,其具有良好的敏感性和广泛的特异性,已在英格兰和威尔士的临床标本 gp60 分型中常规使用 。

成功扩增后,通常采用 Sanger 测序对产物进行分析,理想情况下应进行双向测序,以获得高质量的一致性序列。同时,在构建系统发育树比较 gp60 序列时,需根据研究目的考虑是否去除丝氨酸微卫星序列 。

在参考资源方面,随着隐孢子虫物种和基因型的不断增加,gp60 家族和亚型的命名可能会调整。但 NCBI 的 GenBank 数据库存在更新不及时、数据错误等问题。为解决这些问题,提供了包含当前 gp60 命名主列表的资源页面(https://cryptodb.org/cryptodb/app/static-content/gp60.html),该页面不仅提供了当代命名法,还设有联系链接,方便研究人员提交新的 gp60 物种或家族命名信息,减少命名冲突 。

此外,还有多种软件和网络分析工具可辅助 gp60 研究。CryptoGenotyper 是一款用于分析 gp60 和 SSU rRNA Sanger 序列的自动化工具,可提高基因分型的准确性和速度,其更新版本增加了对 FASTA 文件的支持,并更新了参考数据库。TIDE 算法最初用于分析 DNA 测序数据中的插入和缺失,也可用于解释隐孢子虫 gp60 序列,检测混合感染和 PCR 扩增过程中的错配假象 。未来,在PubMLST.org上建立隐孢子虫 gp60 数据库,有望实现数据共享和更可靠的质量控制 。

建议


为更好地进行 gp60 基因分型和规范命名,提出以下建议:一是根据研究目的和物种选择合适的检测方法和引物;二是充分利用 gp60 资源页面的参考资源和工具,如 CryptoGenotyper,确保命名准确;三是利用氨基酸翻译辅助正确比对和识别新的重复单元;四是参考 gp60 主列表确定亚型家族,发现新特征及时提交更新;五是及时更新或纠正 NCBI GenBank 上的错误记录 。

结论


gp60 基因在隐孢子虫分型和流行病学调查中应用广泛,虽存在一定局限性,但仍能为比较分离株和暴发特征提供有用数据。随着隐孢子虫物种的不断研究,gp60 分型方案持续演变,命名复杂性增加。本文梳理了 gp60 分型的相关细节和规则,提供了标准化命名的资源,有助于推动该领域的研究。虽然多基因座和基因组方法在流行病学调查中的应用将逐渐增多,但目前其仍存在局限性,gp60 分型在可预见的未来仍将发挥重要作用 。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号