综述：研究人类肠道病毒组的方法与途径：从实验台到生物信息学

《mSystems》：Tools and approaches to study the human gut virome: from the bench to bioinformatics

【字体：大中小】 时间：2026年02月09日 来源：mSystems 4.6

编辑推荐：

　　这篇综述系统梳理了肠道病毒组研究的最新技术路线，从病毒富集、分离培养到生物信息学分析，涵盖了病毒-宿主互作机制、定量方法和功能预测工具，为探索病毒组在代谢疾病、炎症性肠病等人类疾病中的因果作用提供了方法学指南。

ABSTRACT

人类胃肠道栖息着来自所有生命领域的多种微生物群落，统称为肠道微生物组。虽然肠道细菌与人类宿主健康和生理学的关系已被广泛研究，但其他组成部分仍未得到充分探索。这包括肠道病毒组——肠道中存在的噬菌体、真核病毒和其他可移动遗传元件的集合。与肠道细菌类似，肠道病毒组与人类健康和疾病存在因果关系。然而，由于病毒组的高度多样性和复杂性，以及与体外培养和计算机检测、注释相关的多重挑战，肠道病毒组的表征要困难得多。

ENRICHMENT AND ISOLATION

实验性探究病毒-细菌宿主相互作用的第一步是获取单个病毒或感兴趣的病毒群落。有限数量的肠道相关噬菌体和真核病毒可以从保藏中心获得。研究直接从肠道或其它环境中培养的病毒，能够探索未知的基因型和表型多样性。环境样本中的病毒富集旨在去除样本中的非病毒实体，同时尽量减少对病毒颗粒的干扰。富集策略包括基于大小的排阻或基于化学的程序。这些技术及其对下游应用（如宏基因组测序）的影响需要仔细考量。所有富集方法都被发现对某些病毒群组存在偏好或偏见。

病毒从环境样本中富集后，可使用对噬菌体敏感的细菌宿主来分离感兴趣的病毒。噬菌体通常与敏感宿主一起孵育以增加病毒颗粒数量，然后使用双层琼脂覆盖法进行培养。然而，并非所有噬菌体都能用此法分离。病毒标记（Viral Tagging, VT）和吸附测序（AdsorpSeq）等替代方法不依赖于噬菌斑形成，并可鉴定细菌宿主。这些方法的局限性在于无法区分有活性和无活性的噬菌体，并假设吸附总是导致成功感染。

病毒富集对测序有显著影响。例如，侧重于DNA病毒的方案会显著降低RNA病毒的回收和表征。病毒富集样本的核酸产量可能较低，因此通常在使用多重置换扩增（MDA）进行非特异性核酸扩增后再进行测序。然而，MDA存在偏好性。总体而言，在调查肠道病毒组时，最建议对配对的原始粪便样本和病毒富集粪便样本进行测序，以捕获最大的病毒多样性。

GENOME SEQUENCING AND CLASSIFICATION

虽然体外方法可以识别和量化病毒-宿主相互作用中的不同步骤，但只有一小部分全球病毒组已被培养。利用不依赖培养的方法（如鸟枪法宏基因组测序）与计算工具相结合，可以更准确地预测和表征样本中的病毒基因组。预测病毒组组成比预测细菌组成更具挑战性，部分原因是当前序列数据库仅捕获了估计的全球病毒多样性的一部分，并且病毒没有像细菌16S rRNA基因那样的通用标记基因。

Viral genome classification

在基于组装的分析之前，需要从测序数据中组装和预测病毒基因组。过滤后， reads 被组装成重叠群（contigs）。宏基因组组装器的选择可能会影响回收的病毒重叠群的数量和质量。随后，使用病毒预测程序将重叠群分类为细菌性或病毒性，从而为下游分析产生病毒基因组。病毒预测程序使用各种策略，包括将用户查询序列与参考数据库比对，或使用机器学习模型对重叠群进行分类。与仅依赖参考数据库的程序相比，使用机器学习的程序在分类病毒重叠群方面更有效。分类后，可以使用CheckV等工具评估未培养病毒基因组（UViGs）的完整性和污染情况。通常还需要对回收的病毒基因组进行去重复处理，以准确量化样本中的病毒群落。对于从宏基因组中回收的不完整病毒重叠群，分箱（Binning）可以将重叠群分组为一致性基因组，但病毒基因组的分箱比细菌或古菌基因组的分箱更困难。vRhyme等工具专门为解决此问题而开发。

Assigning viral taxonomy

将重叠群预测为病毒后，计算工具可以分配病毒分类学，并可以注释病毒的许多特征。由于有限的参考数据库、不完整的已组装UViGs以及缺乏通用基因标记，为病毒基因组分配分类学很困难。为了克服这些技术挑战，已经开发了各种策略对UViGs进行分类。例如，预测的基因可以与大型标记数据库比对，或者使用聚类算法对用户查询基因组进行分组。还可以使用参考基因组训练机器学习模型，根据基因组特征预测UViGs的分类。

BACTERIAL HOST RANGE PREDICTION AND IDENTIFICATION

确定样本中病毒的细菌宿主范围通常是病毒组分析中非常有价值的一步。肠道病毒组可以通过调节肠道微生物组来影响宿主健康。因此，表征感兴趣噬菌体所捕食的细菌宿主可以为噬菌体-哺乳动物宿主健康关系提供进一步的背景信息。

In silicoapproaches for predicting phage-bacterial host ranges

计算机预测细菌宿主范围仍然很困难，工具只能在属级或更高级别可靠地预测细菌宿主。大多数细菌宿主预测工具试图在病毒基因组中搜索细菌信号，反之亦然。这可以通过将病毒序列与大型CRISPR spacer数据库比对来实现。细菌宿主也可以通过无比对方法进行预测。或者，其他工具尝试将UViGs与具有已知细菌宿主的噬菌体关联起来。最近，一个整合了多种这些工具的流程iPHoP被引入。最后，与上述程序不同，一些工具利用网络来预测噬菌体-细菌宿主对。

邻近连接方法（如HiC）也已用于将噬菌体与其目标细菌宿主联系起来。这种方法使用甲醛交联细胞内的DNA分子。然后可以对细菌-噬菌体杂交DNA结构进行计算分析，以识别在处理时哪个噬菌体在目标细菌细胞内。

In vitroapproaches to bacterial host range identification

许多用于从复杂群落中分离特定噬菌体的方法也可以鉴定噬菌体的细菌宿主范围。例如，病毒标记（VT）最初是作为一种高通量方法开发的，用于筛选各种海洋噬菌体并确定其细菌宿主范围。同样，AdsorpSeq也是作为检测噬菌体-细菌宿主对的方法开发的。AdsorpSeq和VT可以提供有关噬菌体-细菌对的信息，因为它们依赖于噬菌体对特定细菌宿主的吸附。

为了克服基于培养的方法可能影响噬菌体-细菌相互作用的问题，一些基于PCR的方法可以直接从样本中识别噬菌体-宿主对，从而绕过培养的需要。微滴数字PCR（ddPCR）和乳液配对分离连接PCR（epicPCR）就是此类方法。

VIRAL QUANTIFICATION

病毒定量是大多数湿实验室和干实验室流程中的关键步骤。在体外方法中，病毒定量对于确定有活性的病毒量非常重要。在计算机方法中，病毒定量对于获得样本中病毒的绝对丰度是必要的。

In vitroviral quantification

用于分离噬菌体-细菌宿主对的主要技术——双层琼脂覆盖法，也是测定样本中病毒浓度的方法。一旦分离，病毒储备液可进行系列稀释并与敏感细菌宿主一起培养。计数噬菌斑并计算病毒滴度。虽然有效，但双层琼脂覆盖法可能耗时耗试剂。因此开发了“单层琼脂覆盖”的变体，实现了高通量噬菌体定量。

应强调的是，依赖培养的方法最适合裂解其目标原核或真核宿主的病毒，对于不诱导裂解的病毒（如肠道中高丰度的crAssphage）或细菌宿主无法鉴定或培养的噬菌体无效。在这种情况下，可以使用替代的病毒定量方法来补充依赖培养的方法（例如基于显微镜的方法）。通常，使用荧光显微镜进行病毒定量，其中病毒颗粒用荧光染料标记然后计数。扫描或透射电子显微镜可用于计数，但由于其更高的分辨率，更适合可视化病毒颗粒结构。与基于噬菌斑的病毒定量方法不同，基于显微镜的技术的主要局限是无法区分有活性和无活性的病毒颗粒。

许多真核病毒可以在敏感细胞系上通过噬菌斑分析法进行定量。然而，一部分真核病毒——内源性逆转录病毒（ERVs）——仍然难以用噬菌斑或显微镜方法定量。相反，ERVs的定量归因于其表达活性。此类测量依赖于使用RT-qPCR或单细胞RNA-seq对ERV mRNA转录本进行定量。

“polonies”定量是另一种不依赖培养的、基于PCR的样本中DNA病毒群组定量的方法。该方法使用一组简并引物来定量整个病毒属的病毒，而不是单个病毒物种。

In silicoviral quantification

为了检测两个样本之间病毒组成和多样性的差异，通常对预测的病毒基因组进行计算机定量。像读段比对这样的方法可以量化属于病毒基因组的读段数量，可以进一步标准化以产生每个基因组在给定样本中的相对丰度。虽然相对丰度可用于计算样本间的差异，但不能用于计算总噬菌体载量。可以通过在样本中加入已知浓度的病毒标准品来获得噬菌体载量的半定量测量。

VIRUS-BACTERIAL HOST DYNAMICS AND VIRAL LIFESTYLE

一旦确定了感兴趣的噬菌体-细菌宿主对，可以采用多种方法来表征它们的动态，范围从经典的病毒学方案到高通量筛选。

In vitromethods for examining phage-bacterial interactions

在噬菌体感染期间，随时间推移测量细菌光密度（例如使用分光光度计）的变化，是表征细菌宿主对噬菌体感染反应并推断噬菌体-细菌宿主动态的常用方法。该技术已用于表征肠道噬菌体与其细菌宿主之间的感染动态。随时间追踪光密度变化也可用于检测原噬菌体诱导。

为了满足高通量需求，已经开发了高通量方案来研究病毒生命周期中的各个步骤。这包括微观噬菌体吸附测定法（MPA），它使用荧光显微镜以单病毒分辨率研究噬菌体-细菌宿主吸附。

基于显微镜的测定法可用于可视化和探究噬菌体-细菌相互作用。例如，PhageFISH是荧光原位杂交的一种适应，可用荧光探针标记许多目标噬菌体基因和细菌宿主rRNA。荧光的存在或缺失可用于表征噬菌体的复制周期和宿主范围。

虽然噬菌体是人类肠道病毒组中主要已知的病毒群，但也存在一群靶向哺乳动物宿主的肠道共生真核病毒。用于表征真核病毒-哺乳动物宿主相互作用的技术是历史上用于研究致病性真核病毒的技术，但可能不广泛适用于肠道共生病毒。

In silicophage lifestyle prediction

噬菌体生活方式的计算机预测也可以提供对噬菌体-宿主动态的洞察。在肠道中，大多数细菌预测携带原噬菌体。然而，肠道病毒组的实际生活方式组成尚未完全阐明。由于可用的参考基因组数量有限以及病毒基因组组装不完整，计算机预测病毒生活方式具有挑战性。一些工具使用由温和性或毒力相关基因组成的训练数据集来预测UViGs的生活方式。然而，使用此策略依赖于基因组是完整的这一假设。为了克服这一点，其他工具使用已知温和和烈性噬菌体的DNA和蛋白质特征数据训练机器学习分类器，以预测查询UViGs的生活方式。此外，一些病毒分类工具，如VIBRANT和GeNomad，可以通过识别细菌特异性基因侧翼病毒特异性基因的区域来预测病毒基因组是否作为原噬菌体整合。

COMMUNITY DYNAMICS

迄今为止，关于肠道病毒组在哺乳动物和人类健康中作用的知识大多是关联性的，依赖于病毒丰度与疾病状态之间的相关性。虽然上述体外方法为病毒组表征提供了宝贵的见解，但它们无法揭示病毒影响整体哺乳动物健康的机制。

*Wet lab methods to study virome dynamics

一些体外系统旨在模拟肠道环境，例如“芯片肠道”模型。有趣的是，在研究噬菌体群落如何在培养中行为时，发现在芯片肠道模型中可以检测到噬菌体和细菌宿主之间的协同进化动态，而在标准液体培养中则不能，这凸显了在研究体外噬菌体-细菌宿主动态时培养条件的重要性。

体内小鼠模型可用于更全面地探究肠道病毒及其与肠道和哺乳动物健康的关系。在无菌（GF）小鼠模型中使用粪便微生物群移植（FMT）可以建立因果关系并确定肠道共生体影响哺乳动物宿主健康的机制。为了更清楚地阐明病毒组对哺乳动物宿主健康的直接影响，GF小鼠模型可以用特定的肠道病毒进行单一定植。GF小鼠也可以通过粪便病毒组移植（FVT）定植复杂的肠道病毒群落。FVT制备依赖于前面讨论的富集方法。将FVT给予GF小鼠表明，共生病毒直接与哺乳动物宿主免疫系统相互作用或调节生理机能，并与IBD病理学建立了因果联系。FVT在非无菌、无特定病原体（SPF）疾病模型中也显示出疗效。

虽然大多数研究肠道病毒组的体内方法涉及添加病毒，但也可以从宿主微生物组中清除病毒。一种这样的方法涉及施用acriflavine，一种已知的噬菌体复制抑制剂。使用此模型，发现肠道噬菌体提高了氨苄青霉素对共生肠道细菌的活性效力。

结合上述几种技术可以是一种强大的方法，同时研究共生细菌和病毒在感兴趣表型中的作用。

In silicoprediction of virome function

除了确定样本的病毒组成外，病毒基因组基因组特征和基因注释的计算机预测可以提供关于病毒或病毒群落在给定环境中执行的功能以及所涉及的病毒基因的信息。例如，噬菌体可以通过辅助代谢基因（AMGs）为其细菌宿主提供额外的适应性优势。在肠道中，编码毒力因子的病毒AMGs与临床队列中的代谢综合征呈正相关。值得注意的是，已发现病毒使用与其细菌宿主不同的遗传密码。在病毒基因组中考虑替代终止密码子的使用显著增加了功能注释，并最小化了细菌基因被错误识别为病毒的情况。一旦预测了基因，可以使用各种数据库对其进行注释。此外，正在开发基于蛋白质结构而非序列相似性来预测蛋白质与已知功能蛋白质相似性的工具。除了对序列进行分类，VIBRANT还提供病毒基因预测和带有“病毒分数”的注释，该分数表示给定基因是病毒来源的概率。

VIRAL PIPELINES

为了标准化和辅助病毒组研究，已经开发了用于体外和计算机方法的流程。

计算机方面，这包括包含上述部分或全部步骤的多个流程，但在特定程序使用上有所不同，这会影响最终预测的病毒数据集。例如，流程在用于从样本中预测UViGs的病毒分类工具数量上差异很大。用户选择的病毒组流程应反映什么最适合他们的样本。

体外方面，多种湿实验室技术已被结合以改进病毒富集的数量和质量。“噬菌体即用”（PoT）方案是一个已发布的从环境样本中分离病毒的工作流程，可在更少天内产生高滴度、低内毒素的病毒储备液。虽然该流程的主要优点是噬菌体储备液的高滴度和高质量，但仍有一些注意事项。

OTHER MGEs

用于提取和生物信息学分析肠道病毒组的众多工具和体外方案已明确针对噬菌体进行了校准。在研究其他可移动遗传元件（MGEs）时，例如非致病性真核病毒、质粒和整合接合元件（ICEs），由于这些实体特征更少，有限的参考数据库和专用工具等挑战进一步加剧。

一些病毒分类器已经在包含噬菌体之外基因组的数据上进行了训练，包括真核病毒和其他MGEs。在ICE的情况下，它们可以通过保守基因或使用开发的工具来识别。当研究人类粪便宏基因组时，发现新鉴定的质粒存在于约70%的检查粪便宏基因组中，并且比最丰富的噬菌体科crAssphage丰度高10倍以上。鉴于质粒对细菌生理学的重要性，以及更广泛地通过其在赋予抗生素抗性和主要细菌毒力因子方面的作用对公共卫生的重要性，进一步开发用于分类和表征质粒的工具和数据库是必要的。

CONCLUDING REMARKS

用于研究人类肠道病毒组的湿实验室实验，尤其是计算工具的格局近年来已显著拓宽，为理解内源性病毒对哺乳动物宿主生理学的影响提供了令人兴奋的新途径。我们期望，对人类病毒组日益增长的兴趣将带来改进的方法学，这些方法学更易于使用，并解决了本综述中强调的许多注意事项和考量。

热点排行

新闻专题