早期生命病毒组研究中污染序列的特征分析与净化策略

【字体: 时间:2025年07月06日 来源:Nature Communications 14.7

编辑推荐:

  本研究针对低生物量样本中外部污染序列严重影响病毒组研究准确性的问题,系统分析了1321例婴儿肠道病毒组样本及55例阴性对照。通过建立"negativeome"污染数据库,首次量化了早期生命样本中61%存在污染序列,其中11%婴儿样本污染率超10%,并开发了基于菌株水平的净化策略。该成果为病毒组研究提供了标准化污染评估框架,发表于《Nature Communications》。

  

在探索人类肠道这个"微生物宇宙"时,病毒作为最庞大的"隐形居民"长期被忽视。尽管肠道病毒数量高达1012个,与细菌数量相当,但其总遗传物质重量仅约50微克。这种极低生物量特性使得病毒组研究,特别是早期生命阶段的样本分析面临巨大挑战——就像在沙滩上寻找特定沙粒,外部污染序列的干扰让真实信号难以辨识。以往研究显示,胎盘和血液微生物组数据曾因污染问题引发争议,但病毒组领域的污染影响仍属未知领域。

荷兰格罗宁根大学医学中心的Nataliii Kuzub、Alexander Kurilshikov、Alexandra Zhernakova和Sanzhima Garmaeva团队在《Nature Communications》发表的研究,通过整合4项早期生命病毒组研究的1321例样本和55例阴性对照(NCs),首次系统揭示了污染序列的特征规律。研究发现61%样本与阴性对照共享至少1个相同病毒株,证明外部污染普遍存在;更令人警惕的是,11%婴儿样本的污染序列占比超过10%,远高于成人样本。

研究采用多技术联合作战:1) 病毒样颗粒(VLP)富集技术处理低生物量样本;2) 四重病毒预测工具(VirSorter2、DeepVirFinder、geNomad、VIBRANT)联合鉴定病毒序列;3) 建立193,970个病毒操作分类单元(vOTUs)数据库;4) 创新性应用inStrain工具进行菌株水平比对。通过这套"组合拳",团队不仅量化了污染程度,更发现阴性对照与真实样本在测序深度、多样性等指标上难以区分,这解释了为何传统质量控制方法可能失效。

研究结果层层递进:首先通过基因组特征比较发现,虽然阴性对照的病毒序列数量和基因组完整性较低,但其与真实样本的差异方向因研究而异,无法建立统一判别标准。更惊人的是,当用这些特征构建年龄预测模型时,阴性对照竟被预测为1-8月龄的"虚假婴儿",直观证明传统质控指标的局限性。

在污染特征解析方面,研究揭示:1) 5984个污染相关vOTUs中仅3株跨研究共享,包括测序常用对照phiX174;2) 与已知实验室污染序列库(LCA)比对,仅有0.6%匹配率,说明现有污染数据库覆盖不足;3) 婴儿样本污染程度显著高于母亲样本,证实低多样性样本更易受污染干扰。通过菌株水平分析发现,34.8%的婴儿样本污染序列与阴性对照完全一致,而母亲样本该比例为零,这为精准去污染提供了分子依据。

研究最终提出双重解决方案:对于有阴性对照的研究,推荐菌株水平去污染法(相比物种水平可多保留3.4%的真实信号);对于历史数据,则可通过本研究公开的negativeome数据库估算污染水平。这些发现不仅为病毒组研究建立了首个标准化污染控制框架,其揭示的"早期生命样本特别脆弱"现象,更提示未来研究需特别关注生命初期微生物组数据的可靠性。正如研究者强调:当探索人类生命最初的"病毒星空"时,必须首先擦净"望远镜镜片"上的污染物。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号