PGIP:基于云端计算的寄生虫基因组快速鉴定平台开发及临床应用评价

【字体: 时间:2025年08月29日 来源:Parasites & Vectors 3.5

编辑推荐:

  本研究针对寄生虫病诊断中传统方法的局限性,开发了基于宏基因组测序(mNGS)的寄生虫基因组鉴定平台(PGIP)。研究人员通过整合280种寄生虫的精选基因组数据库,结合Kraken2和MetaBAT2双算法分析流程,实现了从原始数据上传到自动化报告生成的一站式解决方案。验证显示该平台在血液、脑脊液等复杂样本中均能实现种水平精确鉴定(相对丰度最高93.37%),尤其对形态学难以鉴定的裂头蚴病例具有重要诊断价值。该研究为寄生虫病的精准诊断提供了标准化分析工具,发表于《Parasites》。

  

在全球公共卫生领域,寄生虫病仍是导致数百万人发病的重要病因。尽管卫生条件改善使部分寄生虫病流行率下降,却带来新的诊断困境——临床医生对罕见寄生虫的识别能力普遍降低。传统显微镜检查依赖操作者经验,灵敏度有限;而新兴的宏基因组测序技术(mNGS)虽能无偏倚检测病原体,却受限于生物信息分析的复杂性、参考数据库不完整等问题,难以在临床普及。这种技术鸿沟使得许多寄生虫感染,特别是形态相似虫种(如日本血吸虫与埃及血吸虫)或罕见寄生虫(如广州管圆线虫)的鉴别诊断面临挑战。

针对这一难题,Jiayao Zhang等研究者开发了寄生虫基因组鉴定平台(PGIP)。该研究通过整合NCBI、WormBase等5大数据库资源,采用CD-HIT去冗余(相似度阈值95%)构建含280种寄生虫的精选基因组库,涵盖74种原虫和206种蠕虫。平台采用Nextflow标准化流程,集成Trimmomatic质量控制、Bowtie2宿主DNA去除、Kraken2 k-mer比对(k=21-141)和MEGAHIT-MetaBAT2组装分箱双路径分析,最终通过Contig Annotation Tool(CAT)实现物种注释。所有分析通过Spring Boot架构的云端界面实现"一键式"操作,20GB数据平均1.5小时完成分析。

数据库构建与验证

研究团队从公共数据库系统筛选基因组,要求具备完整编码序列注释和准确物种分类。经CD-HIT去冗余后,最终数据库包含临床常见的华支睾吸虫(Clonorchis sinensis)、恶性疟原虫(Plasmodium falciparum)等关键虫种。通过15组测试数据(含公开数据集和江苏寄生虫病研究所内部样本)验证,平台在粪便(宿主DNA占比高)、血液等复杂样本中均表现稳定。

双模式鉴定性能

reads mapping模式对曼氏裂头蚴(Spirometra erinaceieuropaei)组织样本检出率达93.37%,而组装模式通过MEGAHIT多k-mer迭代策略(21-141bp步长12bp)有效提升低丰度虫种识别。值得注意的是,在1例形态学无法确诊的裂头蚴病例中,PGIP从6100万条reads中鉴定出2858万条曼氏裂头蚴序列,为临床决策提供关键依据。

临床应用优势

相比传统方法,PGIP具有三大突破:1) 种水平鉴别能力,可区分近缘虫种如日本血吸虫(Schistosoma japonicum)与埃及血吸虫(S. haematobium);2) 兼容多样本类型,对脑脊液中福氏耐格里阿米巴(Naegleria fowleri)检出限达29.4%相对丰度;3) 自动化报告整合质量控制指标,如Phred score<20的reads过滤情况。

该研究的创新性在于首次构建了寄生虫特异的标准化分析体系,解决了mNGS在寄生虫诊断中的三大瓶颈:生物信息门槛高、数据库特异性不足、流程碎片化。平台每季度更新的机制确保纳入新测序虫种,如近期新增的广州管圆线虫(Angiostrongylus cantonensis)基因组。研究者建议未来重点优化混合感染样本解析算法,并与显微镜检查、血清学检测形成多模态诊断方案。PGIP的推广应用将显著提升寄生虫病监测能力,特别是在气候变化导致虫媒疾病分布改变的背景下,为公共卫生防控提供关键技术支撑。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号