人类皮肤DNA病毒组综合参考目录揭示新型病毒多样性与微环境影响
【字体:
大
中
小
】
时间:2025年10月01日
来源:Microbiology Spectrum 3.8
编辑推荐:
本研究构建了首个全球规模的人类皮肤DNA病毒组参考目录(SVD),通过分析2760个皮肤宏基因组数据,鉴定出20,927个病毒序列并聚类为2,873个病毒操作分类单元(vOTU),其中90.85%为未知病毒。研究揭示了皮肤微环境(油性、干性、湿润区)对病毒群落结构的显著影响,发现噬菌体(Caudoviricetes)与宿主细菌(如Pseudomonas、Klebsiella、Staphylococcus)的密切互作,为皮肤微生物平衡机制和靶向治疗(如噬菌体疗法)提供了重要资源。
人类皮肤作为一个动态的微生物栖息地,承载着包括病毒在内的复杂微生物群落,其多样性和功能尚未被完全解析。本研究收集了来自6项已发表皮肤研究的2,760个皮肤宏基因组数据,采用病毒组学标准方法构建了皮肤病毒组目录。通过跨队列荟萃分析识别病毒特征,并用于刻画不同皮肤环境中的病毒分布规律。研究共鉴定出20,927条病毒序列,聚类为2,873个病毒操作分类单元(vOTU),揭示了人类皮肤上广泛的病毒多样性。结果凸显了病毒群落在不同皮肤微环境中的显著差异:油性皮肤区域富集Papillomaviridae,干燥皮肤区域富集Autographiviridae和Inoviridae,湿润区域则富集Herelleviridae。研究还探讨了皮肤表面噬菌体与细菌的相互关系,发现Pseudomonas、Klebsiella和Staphylococcus等皮肤细菌可能被Caudoviricetes类噬菌体感染。这一全面的皮肤DNA病毒目录显著推进了我们对病毒组在皮肤生态系统中作用的理解。
研究重要性在于建立了全球采集的2,760个宏基因组数据集的人类皮肤DNA病毒组参考目录,其中90.85%的病毒为以往未知的新病毒,极大拓展了对皮肤病毒多样性的认知。发现不同皮肤微环境(油性、干性、湿润)中病毒群落的显著差异,并强调噬菌体与其细菌宿主间的紧密相互作用,表明病毒组可能在维持微生物平衡和皮肤健康中发挥潜在作用。该皮肤病毒目录为未来流行病学和治疗研究提供了关键资源,可能促进新型噬菌体疗法和皮肤疾病诊断标志物的开发。
皮肤作为人体最大的器官,不仅是抵御化学损伤、紫外线辐射和病原体的保护屏障,还栖息着包括细菌、真菌、古菌和病毒在内的复杂生态系统。这一微生物群落统称为皮肤微生物组,在调节免疫反应、抵御病原体定植和维护皮肤健康中起着关键作用。尽管已有大量研究聚焦于皮肤微生物组的细菌或真菌成分,但病毒组分的多样性和功能仍较少被探索。现有研究表明,病毒在面部皮肤样本中约占微生物群体的1.51%,并在特定样本中出现“病毒暴发”现象,在某些皮肤部位病毒可占微生物群落的96%。皮肤表面最主要的病毒是噬菌体,包括那些靶向Cutibacterium和Staphylococcus的病毒,此外还有潜在的人类病毒病原体如人乳头瘤病毒和Merkel细胞多瘤病毒。
宏基因组测序和生物信息学提供了深入探索病毒组复杂性的工具,克服了传统培养技术的限制。病毒,特别是噬菌体(感染细菌的病毒),被认为是塑造微生物群落动态的关键角色。它们通过裂解周期(病毒在细菌宿主内复制并裂解宿主)和溶原周期(病毒基因组整合进细菌基因组,可能改变宿主细菌行为及致病性)影响细菌的多样性和密度。
探索皮肤病毒组至关重要原因包括:首先,病毒通过影响微生物平衡和宿主免疫反应参与皮肤健康与疾病状态;例如,噬菌体可控制致病菌种群,从而预防或加剧痤疮、特应性皮炎和伤口感染等皮肤状况。其次,理解皮肤病毒组可能开辟治疗途径,如利用噬菌体疗法对抗抗生素耐药菌株。最后,皮肤病毒组可作为某些皮肤疾病乃至系统性疾病的诊断标志物,鉴于皮肤与其他器官的相互作用。
为增强对皮肤病毒组的理解,我们基于全球采集的人类皮肤样本建立了非冗余病毒参考目录。该项目分析了来自美国、中国、新加坡和意大利的2,760个宏基因组数据集,涵盖多种微环境条件。我们构建此目录旨在绘制皮肤病毒组的多样性,探究其与宿主和环境因素的相互作用。
数据收集通过全面回顾皮肤微生物组研究,排除仅依赖ITS或16S测序的研究因其在捕获病毒基因组数据方面的局限性。纳入标准限于使用未进行病毒样颗粒富集的宏基因组测序技术的研究。未根据测序平台、提取方法或文库制备技术的差异过滤研究。从NCBI序列读段存档(SRA)和CNGB数据库共收集下载2,760个皮肤宏基因组数据集。为提供清晰的人口学背景,总结了受试者的年龄、性别、国家和特定皮肤部位,健康个体样本占97.72%,特应性皮炎患者占1.41%,银屑病患者占0.87%。
数据处理使用SOAPnuke过滤原始读段,用bowtie2比对人类基因组hg38以去除人类读段。剩余读段使用MEGAHIT基于多种k-mer大小进行从头组装。
细菌谱构建通过将高质量读段映射到3,547个推定原核物种,使用jgi_summarize_bam_contig_depth计算覆盖深度,并以标准化覆盖深度估算物种相对丰度。
病毒识别和去污染为最大化恢复病毒多样性,纳入大于2,000 nt的contig进行下游分析。通过VIBRANT和DeepVirFinder初步筛选病毒序列,使用hmmsearch搜索细菌、古菌和真菌通用单拷贝直系同源物(BUSCO)并去除,再用BLASTN比对人类基因组去除潜在人源序列,最后用geNomad过滤(病毒评分至少0.7)并用CheckV评估单contig病毒基因组质量与完整性。共识别4,199个完整病毒基因组、5,249个高质量基因组和11,479个中等质量基因组。contig通过BLASTN比对计算相似性和覆盖度,使用HipMCL算法基于95%相似性和85%比对覆盖进行聚类,得到2,873个vOTU。
病毒分类基于geNomad注释结果,遵循ICTV的VMR第19版分类法,98.75%的vOTU被分类。
宿主预测使用iPHoP进行,数据库基于已发表的皮肤微生物组基因组构建。
功能注释使用Prodigal和EggNOG及VOGDB对vOTU的蛋白质编码序列进行预测和注释。
系统发育分析使用ViPTreeGen基于氨基酸序列相似性生成病毒蛋白质组树,用iTOL可视化。
vOTU定量为探索皮肤病毒组的生物地理特征,分析来自油性、湿润和干燥皮肤区域的宏基因组数据,使用bowtie2以>95%一致性阈值比对高质量读段与所有vOTU,使用jgi_summarize_bam_contig_depth进行基于序列的vOTU丰度分析,仅当vOTU连续序列长度的至少75%被读段覆盖时才认为存在于样本中。考虑测序深度差异,使用标准化覆盖深度矩阵估算vOTU丰度。
噬菌体-宿主关联分析通过评估噬菌体vOTU与微生物物种相对丰度的Spearman相关性探索群落内关联。
Alpha多样性基于噬菌体vOTU相对丰度估算,使用vegan包计算Shannon多样性指数,不同微环境和部位间比较使用Wilcoxon秩和检验。
统计分析使用ade4包进行PCoA和PCA,使用vegan包的adonis函数进行PERMANOVA,在调整年龄和性别后分析皮肤微环境和部位特征,统计显著性使用wilcox.test和kruskal.test验证,P值经FDR调整。
人类皮肤病毒目录构建共收集2,760个公开可用的人类皮肤宏基因组数据,建立覆盖美国、中国、新加坡和意大利的皮肤宏基因组数据集,包含来自21个不同皮肤部位的样本,分为油性(1,849样本)、干燥(244样本)和湿润(241样本)三种微环境。统一处理后,样本代表34.11 Tb高质量非人类宏基因组数据,生成2.5056亿条长contig。通过整合流程,约0.96%的contig被检测为高置信病毒序列。完整性预测显示有4,199个完整病毒基因组、5,249个高质量基因组和11,479个中等质量基因组。病毒序列按MIUViG标准聚类,形成由2,873个vOTU组成的皮肤病毒组数据库(SVD),包括558个完整病毒基因组、841个高质量基因组和1,474个中等质量基因组。vOTU代表序列长度范围2,010 bp至433,960 bp,中位长度28,261 bp。
SVD的vOTU与现有病毒目录比较,仅263个vOTU与其他目录中的病毒序列匹配,2,610个vOTU与数据库中任何已知基因组不匹配。
2,873个vOTU共编码119,826个蛋白质编码基因,功能注释显示53,127个基因被两个数据库共同注释。vOTU功能谱的PCoA揭示基于识别功能的聚类差异,不同病毒家族在DNA修复、复制、肽酶和抑制剂及复制修复过程等功能上存在变异。
皮肤病毒的 taxonomic 景观和宿主范围 taxonomic 注释结果显示96.66%的vOTU被分类,其中76.51%被归类为Caudoviricetes类中未识别的科。识别出的病毒家族包括Papillomaviridae、Inoviridae和Rountreeviridae。已知Papillomaviruses是人类皮肤病毒组的成员,代表一类与宿主共同进化并主要定植于人类皮肤表面和毛囊的古病毒。
发现至少6个属于Caudoviricetes类的vOTU出现在至少2,208个样本中(占80%),占总病毒丰度的14.4%。在至少1,380个样本中识别出78个vOTU,占总丰度的31.5%,主要包括Caudoviricetes目中未识别科的72个成员和6个未分类vOTU。这些共生病毒物种可能在人类皮肤中发挥保守作用。
使用iPHoP预测皮肤细菌感染宿主,1,908个vOTU被预测感染皮肤表面细菌,包括Firmicutes、Proteobacteria和Actinobacteriota门成员。在科水平,预测被感染的细菌包括Staphylococcaceae、Moraxellaceae、Mycobacteriaceae、Enterobacteriaceae和Peptoniphilaceae。在属水平,预测被感染的皮肤细菌包括Staphylococcus、Corynebacterium、Acinetobacter、Moraxella和Streptococcus。此外,噬菌体还被预测感染Enterococcus、Klebsiella和Pseudomonas。
进一步分析显示,Caudoviricetes中未分类噬菌体可能感染人类皮肤微生物组中的主要细菌,包括Propionibacteriaceae、Mycobacteriaceae、Staphylococcaceae、Peptoniphilaceae和Moraxellaceae成员。属于特定家族如Autographiviridae、Herelleviridae、Rountreeviridae、Crassvirales和Schitoviridae的Caudoviricetes噬菌体与Pseudomonadaceae、Caulobacteraceae、Enterobacteriaceae、Staphylococcaceae、Mycobacteriaceae和Streptococcaceae相关联。在Caudoviricetes类未分类噬菌体中,预测感染多种细菌的噬菌体预期感染常见皮肤细菌如Staphylococcus、Corynebacterium、Acinetobacter和Moraxella。在Rountreeviridae家族中,预测感染单一属的噬菌体通常感染Staphylococcus、Confluentibacter和Streptococcus。在Inoviridae家族中,预测感染单一属的噬菌体预期感染Acinetobacter、Neisseria、Pseudomonas和Stenotrophomonas。
皮肤噬菌体与细菌组的紧密相互作用为探索皮肤中噬菌体与细菌的相互作用,比较了从2,760个样本收集的噬菌体和细菌谱。结果显示α多样性(Shannon多样性)和β多样性(Bray-Curtis距离)显著正相关,表明紧密的噬菌体-细菌组相互作用。
然后分析了2,760个样本中噬菌体与其预测宿主在属水平相对丰度的一对一相关性,发现平均rs为0.357的正相关,与肠道中发现一致,表明噬菌体与其宿主细菌物种在人类皮肤中共存而非排斥。更重要的是,具有多重耐药潜力的细菌如Pseudomonas、Klebsiella和Staphylococcus存在于人类皮肤上。发现许多噬菌体vOTU与它们显著相关,特别是Caudoviricetes成员包括Rountreeviridae和Herelleviridae。这些高度临床关注的细菌可引起皮肤、血液、肺、胃肠道等部位的疾病。
人类皮肤上病毒的生物地理特征人类皮肤以不同微环境(油性、干燥和湿润)为特征,已显示特定皮肤表型与 distinct 细菌多样性相关。在本研究中,分析了六个数据集中三个具有不同微环境样本的数据集。观察到在CNP0003934中,干燥皮肤的病毒多样性(Shannon)显著高于油性皮肤,与细菌多样性类似。然而,在SRP002480和SRP057859两个数据集中,油性和湿润皮肤的病毒多样性趋势不一致;SRP002480中湿润皮肤多样性高于油性皮肤,而SRP057859中油性皮肤多样性高于湿润皮肤。此外,观察到同一微环境内不同部位间的多样性变异。
PCoA揭示来自不同人群的六个队列间病毒组组成存在显著差异。皮肤微环境和解剖部位对整体病毒组组成有显著影响。整合来自各种研究、部位和微环境的数据,发现对皮肤病毒组最显著的影响源于研究间的差异,占变异的6.14%,其次是部位的影响占3.14%,最小的是微环境占0.08%。随后量化了每个研究中不同皮肤微环境和部位对皮肤病毒组的影响,发现不同微环境和同一微环境内的解剖部位均与病毒组组成显著相关。此外,由于个体异质性与病毒分类变异密切相关,评估了年龄和性别对所有数据中皮肤病毒组的影响。在调整不同研究的影响后,年龄和性别的影响分别为0.08%和0.06%。此外,调整宿主年龄和性别并未显著改变不同皮肤微环境和部位对皮肤病毒组的影响。
对不同皮肤微环境间病毒家族水平的组成分析发现,未分类vOTU占病毒序列的10.35%。在所有数据集中,不同微环境和部位皮肤的病毒组以Caudoviricetes中未在科水平识别的成员以及Papillomaviridae和Inoviridae为主。油性区域特别富集皮肤上最丰富的病毒Papillomaviridae,而干燥区域有较高浓度的Autographiviridae和Inoviridae。湿润区域富集Herelleviridae病毒。总之,皮肤表面的病毒组成表现出微环境特异性和解剖部位特异性。
通过从不同微环境和地理位置的人类皮肤样本构建全面、非冗余的病毒参考目录,我们的研究解决了当前对皮肤病毒组理解中的若干空白。我们发现了大量与任何已知序列不匹配的vOTU,约占我们目录的90.85%,这表明病毒多样性比以往认知的更丰富和多样。我们的分析还揭示了这些病毒与其宿主微环境和更广泛皮肤微生物组维持的复杂关系,揭示了特定微环境和解剖部位如何影响病毒的角色和适应。
我们研究中的一个主要挑战源于宏基因组测序数据,与更 targeted 方法不同,未经过VLP富集步骤也未包括宿主去除步骤。缺乏VLP富集意味着我们的样本未特异性浓缩病毒,因此包含了大量非病毒遗传物质。这种缺乏富集使病毒实体的检测和表征复杂化,特别是那些较少丰度或存在于复杂生物基质中被更 dominant 微生物形式 overshadowed 的病毒。此外,测序前缺乏宿主去除步骤导致高背景噪声的人类DNA。这背景显著使生物信息处理复杂化, required 区分病毒DNA与皮肤样本中 predominant 的人类DNA。因此,识别和编目病毒序列需要实施严格过滤标准以确保病毒序列识别的准确性和可靠性。
尽管付出这些努力,我们方法中固有的局限性强调了未来研究中需要更 refined 方法学。在样本制备初始阶段采用VLP富集和宿主DNA去除可能允许更全面和详细地探索皮肤病毒组。这些步骤不仅将增加病毒序列的产量,还提高信噪比,促进检测稀有和新病毒,这些可能对理解病毒对皮肤健康和疾病全面影响至关重要。
此外,我们的结果凸显了微环境因素和部位对病毒组组成的潜在影响。病毒群落在不同微环境和区域间的变异说明了这些病毒如何适应特定的局部微环境。这种对解剖部位和微环境的特异性表明 localized 治疗 approaches 可能至关重要,因为皮肤病毒组似乎随其周围条件而变化。
对人类皮肤病毒组的这一广泛探索提供了对皮肤微生物组病毒成分的更深入理解,并强调了它们在影响皮肤健康和疾病中的潜在作用。随着我们继续 unravel 皮肤微生物组内的复杂相互作用,这些发现不仅为创新治疗 approaches 铺平道路,还增强了我们对皮肤生物学的理解。前进之路是将这些发现整合进更广泛的生物和临床研究,以充分实现皮肤病毒组在促进健康和治疗疾病中的潜力。
工作得到科技部、中国医学科学院创新基金、国家自然科学基金、广州市科技局创新团队基金和上海市科技重大项目的支持。计算部分在复旦大学CFFF平台上完成。感谢国家基因库和广东省基因组读写的重点实验室在测序和分析上的支持。
J.X.和Z.L.构思研究,Z.L.进行分析,J.X.、J.W.、C.N.和J.K.监督工作并提供资金,Z.L.、S.L.、C.H.、Y.C.、H.Z.、Y.S.、J.K.和J.X.撰写论文,Y.Z.和Y.C.审阅并 critically 修订手稿。所有作者阅读、编辑和批准论文。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号