基于Bloom filter新算法BlooMine揭示隐孢子虫Gp60位点多态感染:全球尺度下牛源毒株多样性显著高于人源,为防控人畜共患隐孢子虫病提供关键基因组学证据
《BMC Genomics》:Investigating within-host population diversity of Cryptosporidium parvum using BlooMine
编辑推荐:
为破解临床样本中隐孢子虫(C. parvum)多重感染(MOI)检测瓶颈,作者开发免比对工具BlooMine,对629份公开Illumina数据挖掘Gp60微卫星,发现牛携带多亚型概率为人2.3倍,且存在跨家族共感染,提示农业高暴露驱动微进化与重组,对 zoonosis 监测意义重大。
隐孢子虫(Cryptosporidium parvum)是一类可引发全球腹泻疫情的单细胞真核寄生虫,每年导致逾20万人死亡。由于临床粪便样本中卵囊量极少,DNA提取困难,全基因组测序(WGS)难以常规开展,因此人们对“同一宿主内是否共存多种虫株”这一关键流行病学问题一直缺乏高通量答案。虫株共存即多重感染(multiplicity of infection, MOI),不仅决定毒力强弱,还可能通过有性重组瞬间“拼凑”出具有新宿主嗜性或耐药表型的子代,给公共卫生防控带来不可预测的风险。传统基于Gp60基因(编码60 kDa表面糖蛋白)片段长度分型虽被广泛应用,但短串联重复(STR)区极易因PCR滑脱产生假等位基因,加之二代测序(NGS)读长短,常规比对方法难以准确解析,于是“真实多态 vs. 技术噪音”成为领域痛点。为此,英国研究团队开发了免比对、基于Bloom filter的算法工具BlooMine,试图直接从原始FASTQ中定位Gp60高度多态区,回答“谁更容易发生多重感染、多重感染如何塑造微进化”两大核心问题。
为验证假设,作者收集并过滤公共数据库中629份C. parvum Illumina数据,涵盖欧、美、亚、非四大洲的牛、人、羊、水牛、双峰驼、小鼠共7个宿主,最终592份样本覆盖Gp60目标区。研究采用三项关键技术:①BlooMine_screen模块以k-mer Bloom filter初筛含目标序列的读长;②BlooMine_SPaln二次软比对,用滑窗罚分模型容忍INDEL,判定读长是否真正携带完整Gp60片段;③BlooMine_MOI通过侧翼探针配对过滤,统计每份样本中≥2条可信等位基因的比例,并以L1=0.15、L2=0.075的滑脱阈值剔除PCR假等位基因。
研究结果
数据集与质控
经深度≥3条、最小等位频率5%过滤,共获得54种Gp60等位基因(A##G##R##-家族格式),其中8种仅作为次要等位基因出现,提示真实多态而非测序错误。
多态感染率
在592份有效样本中,51例(8.6%)被判定为多态,牛占31例,人占18例。分层Cochran–Mantel–Haenszel(CMH)检验显示,牛的多态几率是人源的2.26倍(95%CI 1.08–4.71,p=0.048),且该差异在调整洲别、测序深度、Gp60家族后仍显著(adj OR≈2.69,p=0.015)。
宿主与地理分布
最优势等位基因A15G2R1-IIa在人、羊、山羊样本中占比44%,而亚洲牛群则以A19G1-IId为主(80%)。北美出现3例人源IIa/IIc跨家族共感染,欧洲与北美均发现传统认为“牛特异”的A19G2R1-IIa出现在人样本中,提示宿主可塑性被低估。
等位基因共现与排斥
对140对共现组合进行CMH检验,发现A18G2R1-IIa与A19G2R1-IIa显著共存(|log2OR|=6.96),而A15G1R1-IIa与A5G3-IIc、A19G1-IId与A20G1-IId等呈强烈互斥(p<0.01),提示可能存在宿主内竞争或传播结构限制。
主要等位基因长度效应
逻辑回归表明,STR重复数每增加1个单位,多态感染几率升高15%(OR=e0.1421≈1.15,p<0.001),与“滑链错配”机制相符。
结论与讨论
本研究通过BlooMine首次实现大规模、免比对的Gp60 STR直接挖掘,证实牛群因高强度环境暴露及更长重复序列,更易发生C. parvum多重感染;多重感染不仅可在同一宿主内瞬时产生近缘等位基因,还可能让不同家族、不同物种(如C. tyzzeri-like)有机会性重组,从而成为“基因熔炉”。这一发现为解释隐孢子虫快速微进化、新毒株涌现及跨物种传播提供了机制线索,也提示 livestock 集中饲养场是 zoonosis 关键节点,应优先纳入基因组监测。未来结合长读长测序与多位点/全基因组标记,可进一步量化重组频率,验证“熔炉”假说,为全球 cryptosporidiosis 精准干预提供理论依据。论文已发表于《BMC Genomics》(2025)。