土壤微生物蓝图:澳大利亚优势细菌属分布预测及其对土壤健康的意义

【字体: 时间:2025年10月05日 来源:Molecular Ecology 3.9

编辑推荐:

  本研究通过机器学习模型(RF、QRF)优化,基于1971个表层土壤样本,首次绘制了澳大利亚优势细菌属(如Bacillus、Rubrobacter等)的高分辨率(~1 km)分布图谱,揭示了沿海/内陆富集及纬度相关等四种空间模式,并阐明温度、降水、土壤有机碳(SOC)和pH等关键因子的特异性响应,为土壤健康评估和气候变化应对提供了精准干预策略。

  
ABSTRACT
土壤细菌在碳封存和养分循环等土壤过程中扮演关键角色。尽管土壤细菌群落及其与土壤气候因子的相互作用已被广泛研究,但多数研究聚焦于较宽的分类水平,属水平的分布和响应机制仍待探索。本研究基于1971个表层土壤样本的综合数据集,优化机器学习模型以预测澳大利亚优势细菌属的分布。高分辨率数字图谱(约1 km分辨率)揭示了优势细菌属的四种分布模式:沿海富集型、内陆富集型以及纬度相关型。每个属对温度、降水、土壤有机碳(SOC)和pH等关键因子均表现出独特响应。值得注意的是,同一门内的细菌属对土壤气候条件的响应可能存在显著差异,凸显了属水平分析的重要性。高强度土地利用显著均质化了细菌组成,并增加了Rubrobacter、RB41、Microvirga和Sphingomonas的相对丰度。总体而言,本研究增进了对细菌宏观生态趋势的理解,并为改善土壤健康及提升对环境变化的抵抗力提供了更精准的干预策略。
1 Introduction
土壤细菌是土壤生态系统中数量最丰富的微生物类群之一,构成了陆地生物多样性的重要组成部分。它们在养分循环、碳封存和生态系统生产力中发挥关键作用。其快速的繁殖能力和对多样环境条件的适应能力(源于高突变率和遗传重组)使理解其生态偏好和生物地理格局变得复杂。
特定的细菌类群在各种环境因子塑造的独特生态位中繁衍生息。过去几十年的广泛研究已经在区域、大陆和全球尺度上绘制了土壤细菌的生物地理格局。这些研究表明,表层土壤微生物的空间分布受气候条件、土壤性质、地理距离、植被覆盖和地形因素等生物和非生物因子的共同驱动。一项在美国开展的先驱性研究揭示,土壤特性,尤其是pH,是影响细菌多样性的最主要因素,这一发现得到了后续研究的持续支持。然而,局部土壤条件对更广泛环境影响的响应仍不确定,并可能导致土壤pH的变化。例如,一项全球调查表明,干旱度可对土壤pH产生深远影响,从而间接影响细菌多样性和丰度。尽管这些研究为土壤微生物群落结构的环境驱动因素提供了宝贵见解,但多数关注于细菌丰富度和多样性。
因此,在理解特定细菌类群的生物地理格局及其分布机制方面仍存在显著空白。以往的研究虽然探索了全球土壤细菌的分布模式,但通常集中于广泛的生态集群,而未检验更精细尺度的格局。我们先前的工作成功预测了澳大利亚细菌门的分布图;然而,这种宽泛的分类分辨率可能会忽略生态上的细微差别。例如,在酸杆菌门(Acidobacteriota)内,相同的环境驱动因子可能引发不同亚群的 divergent 响应:较高的pH水平促进亚群1、2和3,但降低亚群4和6的丰度。这些复杂性凸显了更精细分类分辨率的必要性。此外,法国的一项研究预测了特定门内的优势属,但显示出有限的模型精度(r2 < 0.3)。实现对细菌属分布的更准确理解对于识别其生态偏好和评估其对全球环境变化的脆弱性至关重要。
近年来统计建模和机器学习的进步使土壤科学家能够将土壤和气候因子与微生物空间分布联系起来。然而,以往的研究通常依赖有限的土壤样本来预测国家或全球尺度的细菌分布,限制了其捕捉精细尺度环境影响的能力。本研究通过分析来自澳大利亚1971个地点的表层土壤样本来填补土壤细菌属研究的空白。我们评估了土壤特性、植被覆盖、气候和地理距离对土壤细菌属分布的大陆尺度影响。我们假设优势细菌属在澳大利亚表现出独特的分布模式。我们采用机器学习算法来识别塑造细菌属分布的关键因子,并开发高分辨率数字地图。这项大陆空间分析增强了我们对细菌属环境偏好的理解,并为设计未来土壤生物多样性和生态系统功能调查提供了见解。
2 Materials and Methods
2.1 Study Area
我们通过整合多个公开可用数据源及我们自身的前期研究,编制了一个全面的土壤细菌数据集。这些数据源包括:澳大利亚土壤环境生物群系(BASE)、澳大利亚国家地球化学调查(NGSA)和北澳大利亚地球化学调查(NAGS)、美国国家生物技术信息中心(NCBI)的一个数据集、以及我们先前的研究(包括跨越新南威尔士州(NSW)的最新调查)。
针对表层土壤细菌分布的分析,我们选择了0-15 cm深度的土壤样本。我们总共汇总了1971个样本:1095个来自BASE,289个来自NGSA和NAGS,192个来自NCBI,395个来自我们的前期研究。据我们所知,这项研究代表了澳大利亚土壤细菌数据最广泛的覆盖范围。
2.2 Soil Physicochemical Characterisation and Climatic Data Acquisition
为解释细菌的空间格局,我们考虑了关键的土壤理化因子,包括粘土含量、砂含量、pH、土壤有机碳(SOC)、阳离子交换容量(CEC)和磷(P)浓度。气候因子包括年日平均温度(MAT)、年平均降水量(MAP)和年温度范围(TRA)。植被使用每个年季度(Q1, Q2, Q3, Q4)的归一化差异植被指数(NDVI)进行评估,地形变量包括海拔和坡度。这些因子代表了土壤、气候和植被条件的长期平均值。
这些土壤和环境因子源自15个分辨率为90米的协变量栅格图层,包含通过R语言中‘SLGACloud’包获取的土壤气候信息和土地利用信息。TERN基于遥感技术测量关键陆地生态系统,提供随时间变化的环境数据。我们使用R中的‘raster’包基于地理坐标提取了所有因子。
简要来说,我们的1971个样本涵盖了多样化的澳大利亚土壤气候变量:土壤pH范围4.0至9.0,SOC含量0.4%至13.6%,MAP 155至3440 mm,MAT 12.2°C至34.4°C。关于土地利用分类的详细信息,请参阅表S1。简要来说,我们的四个土地利用类别代表了人类影响的梯度:自然土地覆盖了受干扰最小的生态系统;相对自然包括低强度人类相互作用的区域;旱地涵盖了干旱和半干旱地区常见的雨养农业实践;集约利用代表了高强度人类改造的区域。
2.3 Molecular Biology
为表征土壤细菌群落组成,我们利用了16S rRNA基因测序数据。简要流程如下:原始测序数据首先使用FastQC进行质量检查,然后使用FLASH进行合并。操作分类单元(OTUs)在97%序列相似性阈值下使用USEARCH(v8.0.1517)进行聚类。OTUs的分类学鉴定使用SILVA 138数据库进行。尽管合并不同数据集可能引入偏差,但使用多引物数据集研究细菌生物地理格局仍是一种有效方法。为最小化极稀有类群带来的偏差,我们过滤掉了总读数少于10条或在少于两个样本中观察到的细菌OTUs。然后我们对OTU表进行稀释以确保样本间的测序深度均匀。为适应我们四个数据集间测序深度的巨大差异,我们应用了数据集特定的稀释深度。
优势属的鉴定基于平均相对丰度大于0.08%且在超过50%的样本中出现。该标准基于先前研究,并针对我们的数据进行了调整。基于此标准,我们获得了16个优势属,占总相对丰度的25.9%。
2.4 Data Analysis
我们绘制了属水平出现频率与平均相对丰度(log10转换)的关系图,并拟合了非参数loess平滑曲线,计算R2为1减去残差平方和之比。为检验整个细菌属与环境驱动因子的关系,我们使用R中‘vegan’包进行了典范对应分析(CCA)。我们根据MAP对方差解释的平方相关对点进行着色。
为识别优势细菌属对土壤气候因子的非线性响应模式,我们使用‘treeshap’包计算SHAP(Shapley Additive Explanations)值,以阐明每个变量的贡献。我们通过基于Bray-Curtis距离的主坐标分析(PCoA)双标图评估了土地利用对优势细菌属和门水平群落的影响,同样使用‘vegan’包。此外,我们使用‘pheatmap’包创建热图以可视化土地利用对优势细菌属相对丰度的影响。我们还生成箱线图并进行单因素方差分析(one-way ANOVA)以研究不同土地利用类型间土壤气候因子的差异。
2.5 Modelling
我们使用数字土壤制图框架,通过机器学习将微生物观测与环境因子联系起来。我们采用随机森林(RF)模型来评估环境因子与优势细菌类群之间的关系。协变量包括土壤特性(SOC, pH, sand, clay, CEC, P)、气候变量(MAP, MAT, TRA)、植被覆盖(NDVI_Q1, NDVI_Q2, NDVI_Q3, NDVI_Q4)和地形特征(slope, elevation)。为减轻多重共线性,我们计算了所有15个协变量的方差膨胀因子(VIFs),并应用了VIF ≤ 10的保守阈值。超过此阈值的协变量被排除,最终留下10个不相关的预测因子:P, pH, SOC, CEC, MAP, MAT, TRA, elevation, slope and NDVI_Q3。每个优势细菌属的相对丰度作为模型中的响应变量。
模型评估采用10折交叉验证方法。数据集被随机分为10个相等的子集。每次迭代中,九个子集用于训练,剩余一个子集用于验证。此过程重复10次,确保每个子集都被用于验证一次。我们计算了验证统计量,包括均方根误差(RMSE)、决定系数(R2)和一致性相关系数(ρc),以评估整个数据集的模型性能。
基于模型性能,我们选择了用于预测优势细菌属分布的最有影响的环境协变量。然后我们使用分位数回归森林(QRF)模型进行空间预测。QRF模型参数设置如下:树的数量=250,最小节点大小=5,mtry(每次分割尝试的变量数)等于总协变量数的平方根。使用的栅格图层空间分辨率为0.01° × 0.01°(约1 km)。
3 Results
3.1 Dominance and Ubiquity of Bacterial Genera Across Australia
在处理完扩增子测序数据并移除未分类属后,我们从采样点编制了一个包含1913个细菌属的数据集以评估其丰度和出现情况。其中,159个属存在于至少50%的采样点。Bacillus的出现率最高,在97.4%的样本中检测到。就平均相对丰度而言,141个属超过0.1%,占微生物群落总量的55.2%。
通过综合考虑平均相对丰度和普遍性,我们将最优势的属定义为那些在超过50%样本中出现且平均相对丰度大于0.08%的属。这导致了16个优势细菌属的选择:Bacillus, Rubrobacter, Bryobacter, RB41, Acidothermus, Bradyrhizobium, Conexibacter, Candidatus Udaeobacter, Mycobacterium, Microvirga, Sphingomonas, Candidatus Solibacter, TK10, X67.14, Streptomyces, and Subgroup_2。这些属合计占总相对丰度的25.9%。
在优势属中,Bacillus、Rubrobacter和Bryobacter最为突出,平均相对丰度分别为4.18%、3.71%和2.14%。值得注意的是,Rubrobacter仅在58.4%的采样点中检测到,表明其具有更特化的栖息地偏好。Sphingomonas、Bacillus和Bradyrhizobium分布最广泛,存在于澳大利亚超过95%的采样点。
3.2 The Relationship Between the Pedo-Climatic Factors and Bacterial Genus
为理解土壤气候因子如何影响细菌属,我们进行了CCA分析。前两轴解释了细菌群落结构方差的50.52%。在分析的因子中,MAP是细菌属组成的最显著决定因子(r2 = 0.068, p < 0.001),其次是粘土含量(r2 = 0.052, p < 0.001)和SOC(r2 = 0.046, p < 0.001)。
我们进一步探索了优势细菌属的关键决定因子。计算了SHAP值以评估每个变量对预测的影响。SHAP热图表明,SOC和pH是影响优势细菌属的两个最有影响的因子,其次是温度和降水。
较高的SOC水平对Acidothermus、Mycobacterium、Bradyrhizobium和Subgroup_2的丰度有积极影响。Acidothermus、Mycobacterium和Bradyrhizobium在SOC超过2%的土壤中最普遍,而Subgroup_2在SOC高于5%时繁盛。相反,RB41和Sphingomonas偏好SOC含量低于3%的土壤。土壤pH也对细菌属表现出 distinct 影响。低pH条件(低于5.5)有利于Candidatus Solibacter的生存,而较高的pH水平(高于6.5)促进了Microvirga和Rubrobacter的生长。
3.3 Land Use Intensity Affects Soil Properties and the Dominant Bacterial Genera
土地利用显著影响土壤特性,集约土地利用比其他土地利用类型引起更显著的变化。随着土地利用强度的增加,SOC水平下降,而粘土含量、磷、pH和CEC趋于增加。主坐标分析揭示,土地利用显著影响了优势细菌属的组成(r2 = 0.04, p < 0.01),前两轴解释了总变异的44.38%。热图聚类进一步突出了不同土地利用类型间细菌群落组成的明显差异。自然土地利用系统中的细菌群落表现出更大的相似性,并与相对自然环境中的群落紧密聚类,其次是旱地系统,最后是集约土地利用区域。
某些属——如TK10、Subgroup_2、X67.14、Candidatus Solibacter、Acidothermus和Conexibacter——在自然土壤中更丰富。相反,Rubrobacter、RB41、Microvirga和Sphingomonas在集约利用的土壤中显示出增加的丰度。
3.4 Prediction of the Dominant Bacterial Distribution
基于RF分析结果,我们整合了土壤特性、气候变量、植被覆盖和地形的空间图层,以开发澳大利亚优势细菌属的数字地图。模型表现出高精度,大多数R2值超过0.5。
预测图谱揭示了每个优势细菌属独特的空间分布模式。我们使用k均值聚类进行了无监督分类以识别这些模式。基于聚类分析,出现了四种独特的空间模式:沿海富集型、内陆富集型以及两种对应于 broad 气候带的纬度相关模式。
在沿海富集组中,属如Subgroup_2、Acidothermus、Bradyrhizobium、Mycobacterium、Candidatus Udaeobacter和Candidatus Solibacter显示出沿北部、东南部和西南部海岸的区域性富集。例如,Subgroup_2在东南沿海地区的预测相对丰度约为7%,但在中部地区低于0.5%。内陆富集组,包括Microvirga、RB41和Rubrobacter,主要发现于澳大利亚中部。Rubrobacter尤其在中部大部分地区的预测相对丰度超过10%。
其他优势细菌属显示出明显的纬度相关分布模式。Sphingomonas、X67.14和Streptomyces在较高纬度更普遍和丰富,在南部沿海有热点,但在东南澳大利亚普遍性较低。相反,Bryobacter和TK10在较低纬度显示出较高的相对丰度,Bryobacter集中于东部,TK10在西北部更丰富。
4 Discussion
我们发现了澳大利亚土壤中的优势细菌属,其中四个属——Bacillus、Bryobacter、Bradyrhizobium和Mycobacterium——在普遍性和优势度上都位列前十。这一发现与先前的研究一致,表明最广泛分布的细菌物种也是最丰富的。有趣的是,尽管Rubrobacter在丰度上排名第二,但它仅存在于58.4%的样本中,表明其对特定生态位的偏好。我们的预测图谱进一步表明,Rubrobacter可能作为干旱度的指示剂,其分布主要集中在沿海区域。此外,在比较不同国家(即澳大利亚和法国)的细菌属分布时,我们观察到了显著差异。例如,比较两国排名前十的属,只有Bacillus是共有的,其在澳大利亚的相对丰度(4.2%)略高于法国(3.8%)。这种差异,部分源于方法学差异,可能强调了区域土壤气候和地理因子对塑造细菌群落的影响。这些发现凸显了需要进行区域特异性研究以理解细菌的生态偏好,这可以支持全球或大陆微生物模型的发展。
我们的研究首次准确识别了澳大利亚优势属间的独特分布模式,包括沿海与内陆富集以及纬度相关趋势。这种趋势不仅发生在16个优势细菌属中,也可以在其他细菌属中发现。我们的结果表明,门水平的分析可能会忽略细菌分布的重要细微差别。例如,在酸杆菌门(Acidobacteria)内,属如Bryobacter、RB41、Candidatus Solibacter、TK10、X67.14和Subgroup_2表现出四种 distinct 分布模式。单一门内的这种变异强调了宽泛分类方法的局限性,并强调了需要独立研究优势属以捕捉更生态相关的细菌分布图景。我们还发现不同的环境因子驱动这些分布模式。沿海与内陆分布主要由土壤pH和有机碳(SOC)塑造,而纬度相关模式似乎受气候因子影响。理解这些驱动因子可以为土壤管理策略提供信息,以应对气候变化带来的挑战。
在关键环境因子中,pH是内陆富集模式的主要因子,而SOC主导了沿海富集模式。虽然pH与细菌多样性的关系已被充分证明,但我们的研究通过将特定属与特定pH生态位联系起来带来了新的细节。例如,Rubrobacter在中性至碱性土壤(pH 7–8)中最丰富,反映了其最佳生长条件。相反,Candidatus Solibacter和Acidothermus在更酸性的土壤中繁盛,这与它们先前报道的偏好一致。这些属适应如此多变pH条件的能力可能与其在挑战性环境条件下维持膜稳定性、酶活性和DNA完整性的细胞机制有关。此外,我们的分析表明,SOC含量强烈影响Subgroup_2、Bradyrhizobium、Mycobacterium和Acidothermus的分布。这些属与较高的SOC水平呈正相关,而RB41显示出负相关,可能源于不同的碳利用策略。
关于气候,我们的发现表明温度和降水共同驱动高纬度的富集模式,而温度 alone 主要影响低纬度的富集。较高的温度与Bryobacter和TK10的更大丰度相关,特别是在热带地区,这支持了先前将微生物呼吸速率与温度联系起来的研究结果。降水也影响了如Streptomyces等属,其在较湿环境中减少,可能由于水分胁迫诱导的细胞破裂。这些结果突出了气候因子与微生物分布之间的相互作用,表明温度和降水驱动纬度相关模式。理解这些关系可以帮助土壤科学家预测细菌对全球气候变化的响应。
增加土地利用强度显著改变土壤理化特性,均质化细菌多样性和群落组成,即使在 higher 分类水平也是如此。自然和相对自然区域表现出最大的细菌相似性,而集约土地利用导致最显著的分化。这种微生物均质化与早先的报告一致,其中土壤特性的变化——特别是SOC下降——导致了细菌群落的转变。Acidothermus、Mycobacterium和Subgroup_2的减少,以及RB41在集约利用区域的丰度增加,进一步支持了这一模式。植被的变化也可能影响细菌组成,因为植物群落的转变改变了养分可用性和根际相互作用,Candidatus Udaeobacter对此类变化 notably 敏感。这些结果表明需要可持续的土地管理实践以保护微生物多样性和维持土壤健康。
在更精细的分辨率上理解细菌群落使土壤科学家能够实施更有针对性的土壤管理策略以应对气候变化和人类活动带来的威胁。虽然我们的研究为优势细菌属的分布及其环境驱动因素提供了重要见解,但在地理上仅限于澳大利亚。未来的研究应采用更有针对性的方法,专门调查关键的功能细菌进化枝,如植物促生细菌或植物病原体,因为这些类群对土地管理策略有直接意义。此外,检验类似的富集和分布模式是否适用于其他地区和生态系统,并整合其他土壤生物,如真菌和原生生物,可以提供对微生物群落及其在土壤生态系统中作用的更全面理解。
5 Conclusion
本研究解决了在大陆尺度上理解土壤细菌属分布的空缺。我们开发了整合土壤和气候因子的预测模型,为澳大利亚的细菌分布提供了强有力的证据。我们的模型强调,土壤气候因子——包括土壤特性(特别是pH和SOC)、气候条件、植被指数和地形变量——显著解释和预测了优势细菌属的分布。预测的热点图谱揭示了四种重要的分布模式:沿海富集型、内陆富集型、低纬度富集型和高纬度富集型。这些生物地理格局及其环境控制为土壤微生物生态学提供了宝贵见解,提供了关于大尺度微生物机制的基本信息。这种详细制图增强了我们预测细菌群落对环境变化、土地利用和气候变率响应的能力,为土壤健康监测和保护工作提供了一个稳健的框架。这些模型可用于帮助土地管理者识别细菌热点,使他们能够制定定制的土壤管理策略以维持或增强微生物多样性和生态系统服务,如养分循环和碳封存。识别出的分布模式还可以指导土壤恢复和生物多样性保护的有针对性努力,特别是在面临退化风险的区域。
Author Contributions
Mingming Du设计了研究,进行了分子工作,进行了统计分析,并领导了写作和编辑。Peipei Xue为分子工作、统计分析和手稿编辑做出了贡献。Budiman Minasny和Alex McBratney为研究设计和手稿编辑做出了贡献。Vanessa Pino, Patrice de Caritat为分子工作和手稿编辑做出了贡献。Mario Fajardo Pedraza, Ji-Zheng He, Qinglin Chen和Andrew Bissett为分子工作做出了贡献。
Conflicts of Interest
作者声明不存在利益冲突。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号