利用机器学习和组学技术识别环境因素对土壤中碳(C)、氮(N)和磷(P)循环过程中微生物功能组成的影响

《Journal of Geophysical Research: Biogeosciences》:Harnessing the Power of Machine Learning and Omics to Identify Environmental Regulation on Microbial Functional Composition for Soil C, N, and P Cycling

【字体: 时间:2025年10月23日 来源:Journal of Geophysical Research: Biogeosciences 3.5

编辑推荐:

  微生物酶功能分类(EFCs)的环境调控机制及机器学习预测模型研究。基于美国大陆575个代谢组学数据集,将118个相关基因分为8个EFCs(如碳水化合物、木质素、有机氮等),利用集成机器学习模型结合环境因子(气候、土壤化学、植被)解析其空间分布规律。研究表明:土壤碳含量、C/N比率、降水、温度及植被生产力显著影响EFCs丰度,微生物群落通过调整酶合成策略优化资源利用,如干旱地区减少木质素降解酶,增加抗逆酶;高生产力地区减少营养获取酶。该模型为生态系统模型参数化提供新方法。

  土壤微生物群落通过释放多种胞外酶来催化土壤碳(C)、氮(N)和磷(P)的循环,从而调控关键的生态系统功能,包括土壤碳固存、养分循环以及土壤肥力。然而,如何在地球系统模型(ESMs)中准确表示微生物过程仍然是一项挑战,因为对不同微生物功能在空间分布中所扮演的角色以及其在不同环境下的调控机制了解有限。本研究通过整合大陆美国(CONUS)地区的已发表宏基因组数据和相应的环境信息,识别出数百个与土壤C、N、P循环相关的微生物基因,并将其归类为八个酶功能类别(EFCs)。每个EFC代表一组可能的基因编码酶,这些酶能够分解相似的土壤化合物。通过将这些EFC的丰度与环境信息相结合,我们训练了一个机器学习(ML)模型,以识别影响每个EFC丰度的关键土壤、气候和植被因素。定量分析表明,这八个EFC在CONUS的分布反映了微生物群落在资源有限、有机矿物结合偏好和气候压力下的潜在资源优化策略。这一发现,结合机器学习工具和CONUS级别的EFC丰度基准,为生物地球化学模型中环境调控微生物功能动态的参数化提供了新的思路。

本研究的目标是探索环境因素如何影响土壤微生物功能的组成。我们首先收集了来自美国能源部联合基因组研究所(JGI)的宏基因组数据,以及来自国家生态观测网络(NEON)的环境信息。我们关注的是来自环境干预和梯度实验的土壤样本的shotgun宏基因组测序数据。由于这些数据来自相同的数据源,所有shotgun宏基因组数据均使用illumina NovaSeq平台进行测序,并通过标准化的DOE JGI宏基因组工作流程进行处理,包括自动组装、注释和分组,同时进行多轮质量检查、人工制品和污染去除。最终的数据以标准化格式提供,附有详细的统计信息和质量指标,便于跨样本和研究的比较分析和数据质量评估。根据JGI测序和组装标准,我们收集了满足或超过标准草稿测序质量的宏基因组数据集,并确保其与相应的环境数据相匹配。

在这些数据的基础上,我们开发了一个机器学习流程,以预测八个EFC在不同环境下的丰度。我们使用了四种基于树的机器学习算法,包括装袋(bagging)、随机森林(random forest)、自适应提升(adaptive boosting)和梯度提升(gradient boosting),这些算法能够处理高维数据和复杂的非线性关系,且不需要严格的统计假设,如正态分布或独立观察。为了提高机器学习流程的泛化能力并减少因数据量和结构而可能导致的过拟合风险,我们引入了数据预处理和增强工具、集成学习框架以及基于蒙特卡洛的交叉验证。数据预处理和增强包括因子选择、分类数据转换和数据标准化,以减少环境因子之间的共线性并增加数据的变异性。最终,我们得到了一个包含575个实例的数据集,用于训练和验证机器学习流程。每个实例包含八个特定EFC的相对丰度以及对应的11个环境因子。所有环境因子在应用前均统一单位并进行标准化处理。

为了评估重要环境因子对EFC丰度的相对重要性,我们使用了基尼重要性分析(Gini importance analysis)。该方法通过计算决策树中基于特定环境因子进行数据分割时的纯度提升,来衡量每个因子的平均增益。每个决策树将训练数据集根据特定的环境因子分成具有相似EFC丰度的子集。通过计算每个子集在该环境因子分割前后的方差变化,我们可以得到基尼值或杂质值。较高的基尼值意味着该组的相似性较低,而显著的基尼值下降则表明该因子能够有效分类样本并提升EFC丰度的预测能力。我们计算了每个环境因子在所有决策树的所有节点中的平均基尼值下降,将其标准化以表示其对预测EFC丰度的相对重要性。根据这一分析,我们排除了对预测EFC丰度不重要的氮和磷施肥率,并重新训练和测试了机器学习模型。

通过基尼值分析,我们发现土壤C含量、土壤C/N比、沙粒含量、粉砂含量、年平均降水(MAP)、年平均温度(MAT)、净初级生产力(NPP)和土壤类型是预测八个EFC丰度的关键环境因子,而氮和磷施肥率则不显著。土壤C含量是预测EFC_Carbohydrate丰度的主要因素,其基尼值超过60%。土壤C/N比和MAP则是预测EFC_Lignin丰度的关键因子,分别占20%和15%。EFC_OrganicN丰度主要受粉砂含量(23%)、沙粒含量(22%)和土壤类型(18%)的影响,而MAT和NPP也有一定作用。EFC_MonomerN丰度则主要受MAT(27%)、土壤类型(22%)和土壤C/N比(18%)的影响,而粉砂含量和土壤C含量也有一定作用。相比之下,NPP是预测EFC_InorganicN丰度最重要的因素,其基尼值为30%。对于EFC_OrganicP丰度,MAP(35%)、土壤C/N比(20%)和土壤类型(15%)是主要影响因子。EFC_MonomerP丰度主要受土壤C含量(25%)和沙粒含量(21%)的影响,而土壤C/N比、MAT和粉砂含量也有一定作用。EFC_InorganicP丰度主要由土壤C/N比(25%)和沙粒含量(23%)决定,其次是MAP、MAT和粉砂含量。

为了验证机器学习模型的性能,我们计算了训练集和测试集的R2值和一致性相关系数(CCC)。在训练集和测试集中,所有EFC的R2值和CCC值均在0.85至0.93之间,显示出模型具有较高的预测能力。R2值和CCC值在训练集和测试集之间的差异较小,表明模型在不同数据集上的表现稳定。此外,R2和CCC值的标准差(SD)在训练集和测试集中均小于0.02,表明模型的预测结果具有较高的可靠性。通过将模型预测的SD值与宏基因组数据的SD值进行比较,我们发现模型能够准确捕捉EFC丰度的空间变化。

为了进一步理解这些环境因子如何影响EFC丰度,我们进行了累积局部效应(ALE)分析。ALE分析能够分解、解释和可视化每个环境因子及其可能的交互作用对机器学习模型预测的平均影响。我们绘制了1D和2D的ALE图,以展示主要环境因子对EFC丰度的影响,以及两个环境因子之间的联合效应。例如,EFC_Carbohydrate的丰度随着土壤C含量从12%增加到50%而显著上升,表明土壤C含量是最重要的预测因子。土壤C/N比的变化导致EFC_Carbohydrate丰度波动,范围在-5%到10%之间。相比之下,EFC_Carbohydrate的丰度对海拔、粉砂含量和MAT的影响是非单调的。随着海拔从250米增加到490米,EFC_Carbohydrate的丰度下降约20%,并在更高海拔处趋于稳定。粉砂含量从10%增加到30%时,EFC_Carbohydrate的丰度下降约15%,随后稳定。MAT从12°C上升到15°C时,EFC_Carbohydrate的丰度增加了20%。这些主要效应受到与海拔的交互作用影响,特别是在土壤C含量高于5%和海拔高于490米的区域,这种联合效应导致EFC_Carbohydrate丰度的变化范围在-60%到60%之间。

在更详细的分析中,我们发现环境因子对EFC丰度的影响存在复杂的交互作用。例如,EFC_Lignin的丰度在土壤C/N比从5增加到10时上升了40%,然后稳定,随后随着土壤C/N比从20增加到40时再次上升20%。在年平均降水(MAP)低于1,000毫米的较干旱地区,EFC_Lignin的丰度随着MAP的增加而上升,但在MAP达到1,250毫米时下降约10%。EFC_Lignin的丰度随着年平均NPP从100增加到375克C/平方米而下降约20%,随后稳定。在MAP低于1,000毫米和NPP为375克C/平方米的区域,MAP和NPP的强交互作用放大了它们对EFC_Lignin丰度的影响,导致其变化范围在35%到-13%之间。在MAP超过1,000毫米的区域,EFC_Lignin的丰度随着MAP的增加而上升,但随着NPP的增加而下降。随着海拔从400米上升到更高,EFC_Lignin的丰度下降约20%。此外,EFC_Lignin的丰度随着土壤C含量从0.5%增加到5%而上升约20%,但在更高的土壤C含量下略有下降。在分析的七种土壤类型中,荒漠土(Aridisols)的EFC_Lignin丰度最高,比平均值高出20%。与这些环境因子相比,MAT和土壤质地的影响较小。

EFC_OrganicN的丰度随着土壤粉砂含量从10%增加到30%而下降,从10%到-20%;随着沙粒含量从37%增加到87%,其丰度下降从10%到-20%。由于土壤粉砂和沙粒含量的强交互作用,土壤质地的联合效应表明,细粒土壤(较低的粉砂和沙粒比例)比粗粒土壤(较低的粉砂但较高的沙粒比例)具有更高的EFC_OrganicN丰度。EFC_OrganicN的丰度随着海拔从500米上升到更高而下降约20%,然后趋于稳定。其他关键环境因子如土壤C/N比、MAP、MAT和NPP对EFC_OrganicN丰度的影响较小,但它们与海拔的交互作用更为显著。在海拔低于500米的区域,EFC_OrganicN的丰度随着海拔和MAT的上升而下降,而在海拔高于500米的区域,EFC_OrganicN的丰度随着NPP的增加而上升,随后在更高的NPP下下降。这种NPP效应在更高海拔区域被放大。

EFC_MonomerN的丰度主要由温度和海拔调节,特别是它们的交互作用。EFC_MonomerN的丰度随着MAT从4°C上升到8°C而波动,范围在-8%到8%之间,随后随着MAT的进一步上升略有下降。海拔从2,500米上升到3,200米时,EFC_MonomerN的丰度增加了10%。温度和海拔的交互作用放大了MAT的主要效应,导致EFC_MonomerN的丰度在MAT和海拔从500米到3,200米的范围内波动,范围在-30%到30%之间。在海拔低于500米的区域,EFC_MonomerN的丰度随着MAT和海拔的上升而增加。此外,EFC_MonomerN的丰度随着土壤C/N比从3增加到8而上升约20%,随后随着土壤C/N比继续上升到40而逐渐增加。这种土壤C/N比的正效应在海拔低于500米的区域被放大,导致EFC_MonomerN的丰度随着土壤C/N比的上升和海拔的下降而波动,范围在-40%到40%之间。EFC_MonomerN的丰度在土壤沙粒含量低于40%时比平均值高40%,但随着沙粒含量增加到50%时急剧下降,随后趋于稳定。相比之下,土壤C含量的增加到10%支持了20%更多的EFC_MonomerN,这种正效应在海拔低于500米的区域被放大,而在海拔高于500米的区域则被增强。

EFC_InorganicN的丰度主要受NPP、土壤C含量、土壤C/N比和MAP的影响。NPP从400增加到800克C/平方米时,EFC_InorganicN的丰度从12%下降到-20%,随后在更高的NPP下逐渐下降。由于NPP与海拔的交互作用,这种负效应在海拔低于400米的区域被缓解,而在海拔高于400米的区域被放大。土壤C含量从0.5%增加到5%时,EFC_InorganicN的丰度从-10%增加到8%,但在更高的土壤C含量下略有下降。土壤C/N比的正效应在3到10的范围内,EFC_InorganicN的丰度从-5%增加到5%。然而,当土壤C/N比上升到20时,这种正效应变为负,导致EFC_InorganicN的丰度从5%下降到-3%,随后趋于稳定。在海拔高于500米的区域,土壤C/N比与海拔的交互作用缓解了土壤C/N比的正效应。此外,EFC_InorganicN的丰度随着MAP从1,000增加到1,300毫米而下降12%,随后随着MAP的进一步增加略有下降。尽管土壤粉砂含量本身对EFC_InorganicN丰度没有显著的主要效应,但其与海拔的交互作用导致在高粉砂含量的土壤中EFC_InorganicN的丰度下降。

EFC_OrganicP的丰度主要受MAP、土壤C/N比、土壤类型和土壤C含量的影响。在MAP低于900毫米的区域,EFC_OrganicP的丰度比平均值低23%,但随着MAP增加到1,200毫米时上升到30%。此外,土壤C/N比低于20时对EFC_OrganicP丰度的影响较小,但当土壤C/N比从20增加到40时,EFC_OrganicP的丰度急剧上升到30%。由于降水与土壤C/N比的交互作用,这种正效应在MAP低于1,200毫米的干旱区域被放大。EFC_OrganicP的丰度随着土壤C含量从0.5%增加到5%而迅速下降,从10%的上方变为5%的下方,随后逐渐下降。土壤C的负效应在MAP低于1,000毫米和土壤C低于5%的区域被放大,导致土壤C和MAP的联合效应使EFC_OrganicP的丰度下降40%。在分析的七种土壤类型中,荒漠土(Aridisols)的EFC_OrganicP丰度最高,比平均值高出18%。

EFC_MonomerP的丰度主要受土壤C含量和沙粒含量的影响。随着土壤C含量从0.5%增加到5%,EFC_MonomerP的丰度从-20%增加到10%,随后随着土壤C含量的进一步增加下降15%。尽管土壤C/N比本身对EFC_MonomerP丰度的影响较小(-5%到5%),但它放大了土壤C的负效应,导致EFC_MonomerP的丰度从18%下降到-18%。在土壤C/N比为10-20和土壤C含量为5%-10%的土壤中,EFC_MonomerP的丰度最高。在沙粒含量低于35%的土壤中,EFC_MonomerP的丰度保持在15%的上方,随后随着沙粒含量增加到85%而下降到-15%。此外,随着粉砂含量从5%增加到25%,EFC_MonomerP的丰度从15%下降到-3%,随后趋于稳定。由于粉砂和沙粒含量的强交互作用,土壤质地的联合效应表明,在粉砂含量约30%和沙粒含量约50%的土壤中,EFC_MonomerP的丰度较低,而在粉砂或沙粒含量较高的土壤中则较高。MAT低于8°C时,EFC_MonomerP的丰度比平均值低10%,而MAT上升到20°C时,EFC_MonomerP的丰度上升到11%的上方。尽管海拔对EFC_MonomerP的影响较小,但其与土壤C和粉砂含量的交互作用显著。因此,随着土壤C和海拔的增加,EFC_MonomerP的丰度从25%下降到-33%。随着粉砂含量和海拔高于500米的增加,EFC_MonomerP的丰度从38%下降到-15%。NPP的增加最初略微提高了EFC_MonomerP的丰度,但当NPP达到800克C/平方米时,EFC_MonomerP的丰度急剧下降到其平均值的10%以下,并且之后没有显著变化。

EFC_InorganicP的丰度主要受土壤C/N比和沙粒含量的影响。随着土壤C/N比从4增加到10,EFC_InorganicP的丰度上升了40%,随后在进一步增加的土壤C/N比下趋于稳定。EFC_InorganicP的丰度在沙粒含量低于35%的土壤中比平均值高10%,但在沙粒含量达到85%时下降到平均值的35%以下。相比之下,随着粉砂含量从7%增加到30%,EFC_InorganicP的丰度从3%下降到-10%,但更高的粉砂含量支持更高的EFC_InorganicP丰度,达到平均值的20%以上。土壤质地的联合效应表明,在细粒土壤(较高的粉砂和较低的沙粒比例)中,EFC_InorganicP的丰度较高,而在粗粒土壤(较低的粉砂和较高的沙粒比例)中较低。然而,这种土壤质地效应在不同海拔下有所变化。随着海拔的增加,EFC_InorganicP的丰度从10%的上方逐渐下降到20%的下方。土壤质地与海拔的联合效应表明,在低海拔(<500米)且粉砂含量低于30%的区域,EFC_InorganicP的丰度较高;而在沙粒含量低于40%的区域,其丰度较低。MAT从-3°C增加到4°C时,EFC_InorganicP的丰度上升了30%;而MAP增加到1,250毫米时,EFC_InorganicP的丰度上升了20%,之后对EFC_InorganicP的影响较小。

通过将网格化的土壤环境因子整合到训练和测试的机器学习流程中,我们预测了CONUS各地的八个EFC的组成变化。EFC_Carbohydrate的丰度在东北、中大西洋、东部奥扎克复合区、东南部草原半岛、西部阿巴拉契亚和坎伯兰高原以及南部平原生态区较高,而在西北部显著下降。EFC_Lignin的丰度在CONUS范围内的变化范围为0.12%到0.26%,在东部美国(尤其是东北、中大西洋、上东南和东部南部平原)最为丰富,而在西部地区较低。EFC_OrganicN的丰度通常在0.7%到1.1%之间,主要分布在东部美国,包括中大西洋、阿巴拉契亚和坎伯兰高原、奥扎克复合区和草原半岛,显示出向山脉西部逐渐下降的趋势。EFC_MonomerN的丰度范围在0.04%到0.08%之间,在东北、中大西洋、阿巴拉契亚和坎伯兰高原、奥扎克复合区和草原半岛以及太平洋西北部较高,而在西南部较低。相比之下,EFC_InorganicN的丰度在北方平原、北方落基山脉、大盆地、南方落基山脉和科罗拉多高原较为丰富,其丰度范围在0.6%到0.8%之间。EFC_OrganicP的丰度范围在0.26%到0.36%之间,在东北、太平洋西南部和奥扎克复合区的角落显著较高。EFC_MonomerP的丰度在奥扎克复合区、南部平原、中部平原、北方平原和太平洋西南部最高,范围在0.13%到0.19%之间。EFC_InorganicP的丰度通常在0.02%到0.14%之间,在大部分东部美国显著较高,但在五大湖、大盆地、沙漠西南部、南方落基山脉和科罗拉多高原地区较低。总体而言,我们的研究结果表明,与有机C和N降解相关的EFC呈现出从东向西逐渐减少的趋势。

通过将网格化的土壤环境因子整合到训练和测试的机器学习流程中,我们预测了CONUS各地的八个EFC的组成变化。EFC_Carbohydrate的丰度在东北、中大西洋、东部奥扎克复合区、东南部草原半岛、西部阿巴拉契亚和坎伯兰高原以及南部平原生态区较高,而在西北部显著下降。EFC_Lignin的丰度在CONUS范围内的变化范围为0.12%到0.26%,在东部美国(尤其是东北、中大西洋、上东南和东部南部平原)最为丰富,而在西部地区较低。EFC_OrganicN的丰度通常在0.7%到1.1%之间,主要分布在东部美国,包括中大西洋、阿巴拉契亚和坎伯兰高原、奥扎克复合区和草原半岛,显示出向山脉西部逐渐下降的趋势。EFC_MonomerN的丰度范围在0.04%到0.08%之间,在东北、中大西洋、阿巴拉契亚和坎伯兰高原、奥扎克复合区和草原半岛以及太平洋西北部较高,而在西南部较低。相比之下,EFC_InorganicN的丰度在北方平原、北方落基山脉、大盆地、南方落基山脉和科罗拉多高原较为丰富,其丰度范围在0.6%到0.8%之间。EFC_OrganicP的丰度范围在0.26%到0.36%之间,在东北、太平洋西南部和奥扎克复合区的角落显著较高。EFC_MonomerP的丰度在奥扎克复合区、南部平原、中部平原、北方平原和太平洋西南部最高,范围在0.13%到0.19%之间。EFC_InorganicP的丰度通常在0.02%到0.14%之间,在大部分东部美国显著较高,但在五大湖、大盆地、沙漠西南部、南方落基山脉和科罗拉多高原地区较低。总体而言,我们的研究结果表明,与有机C和N降解相关的EFC呈现出从东向西逐渐减少的趋势。

我们还分析了样本聚类和空间自相关对机器学习模型预测环境调控EFC丰度及其空间分布的影响。虽然空间自相关和样本聚类可能存在于不同地点收集的环境和土壤数据中,但在使用机器学习预测和解释土壤属性时,这些聚类效应通常被忽略,可能引入预测和解释的偏差。通过计算OGC排除的机器学习流程的预测残差的ICC值,我们发现八个EFC的ICC值均小于0.02,表明样本聚类对我们的机器学习模型性能影响极小。数据集中的九个环境预测因子和八个EFC的莫兰指数(Moran’s I)显示,海拔(Moran’s I=1.49, p<0.01)、温度(Moran’s I=1.06, p<0.01)和土壤沙粒比例(Moran’s I=0.60, p<0.01)具有强空间自相关性。土壤类型显示出中等的空间自相关性(Moran’s I=0.52, p<0.01)。相比之下,NPP、MAP、土壤C、土壤C/N比和粉砂比例的空间模式几乎可以忽略。在八个EFC中,EFC_OrganicP(Moran’s I=0.48, p<0.01)、EFC_InorganicP(Moran’s I=-0.30, p<0.01)和EFC_InorganicN(Moran’s I=-0.43, p<0.01)表现出中等的空间自相关性。其余四个EFC则表现出弱的空间自相关性。这些结果突显了我们数据集中存在的空间自相关性。

为了评估这种空间自相关数据结构对机器学习预测的影响,我们估计了来自机器学习流程的预测残差的莫兰指数。八个EFC的莫兰指数范围在-0.01到0.01之间(图S5)。对于EFC_Carbohydrate、EFC_MonomerP和EFC_InorganicP,p值大于0.05,表明没有统计学意义上的空间自相关性。其余五个EFC的p值小于0.05,但空间自相关性的程度微弱。这表明我们的机器学习流程能够考虑到数据集中的某些空间结构,而无需显式地引入空间坐标。

为了进一步优化机器学习模型对环境调控EFC丰度的预测,并增强EFC丰度的区域预测的稳健性,我们整合了斜向地理坐标(OGC)与其他环境因子,训练和测试了我们的机器学习流程。从这个OGC整合的机器学习流程中获得的莫兰指数在八个EFC中下降到-0.001到0.006之间,并且对于大多数EFC来说,统计上不显著(p>0.05),除了EFC_OrganicN和EFC_OrganicP(p值<0.05)(图S6)。这表明引入OGC表示的空间信息进一步消除了弱空间自相关性。OGC整合的机器学习流程与OGC排除的流程之间的R2和CCC值相似(图S7),表明空间自相关性并未显著影响机器学习流程的准确性。在整合OGC后,大多数EFC的重要环境因子的排序仍然一致,除了EFC_Lignin、EFC_OrganicN、EFC_InorganicN和EFC_OrganicP,其中OGC也是重要的调控因子(图1与图S4)。OGC整合和排除的机器学习流程之间的ALE分析表明,OGC特征的引入略微影响了EFC_Lignin对NPP、土壤类型和土壤C的响应幅度,以及EFC_OrganicP对MAP和土壤类型的响应幅度,但并未改变其响应趋势(图S8h、S8j、S8k、S8ab和S8ae)。整合OGC特征隔离了空间自相关性的影响,使EFC_OrganicN对海拔、MAP和NPP的响应,以及EFC_InorganicN对MAP的响应呈现出更平滑、更一致的趋势(图S8n、S8p、S8r和S8aa)。这一结果表明,引入空间信息可以略微提高EFC_OrganicN和EFC_InorganicN预测的泛化能力,并减少局部过拟合。

最终,通过比较OGC整合和排除的机器学习流程对CONUS的1×1公里预测(图4和图S9),我们发现大多数EFC丰度的空间模式保持一致,例如与有机C和N分解相关的EFC从东向西逐渐减少,以及西北部EFC_InorganicN丰度较高。然而,引入空间信息增加了EFC_Lignin的丰度,同时在数据缺乏的奥扎克复合区生态区减少了EFC_OrganicN和EFC_MonomerP的丰度(图S9b、S9c和S9g)。此外,OGC整合的机器学习流程的预测显示了两种线性人工制品:一种是在南部平原和中部平原边界处的EFC_OrganicP、EFC_MonomerP和EFC_InorganicP,另一种是在东北生态区底部边界的EFC_Lignin、EFC_OrganicP和EFC_InorganicP(图S9b、S9f、S9g和S9h)。尽管OGC角度已优化(文本S4),但OGC可能仍不能完全代表空间复杂性,从而导致人工制品。

根据OGC整合和排除的机器学习流程对CONUS级EFC预测的一致性,以及高、中、低质量环境数据的空间分布(图S1),我们对预测进行了分类,分为三个置信等级。"高置信度"预测覆盖了九个生态区,这些生态区拥有密集的样本级和站点级土壤环境数据,并且两个机器学习流程的预测一致(图S9)。"中置信度"预测出现在阿巴拉契亚和坎伯兰高原以及中大西洋生态区,这些生态区仅有站点级和网格级环境数据可用。"中置信度"预测还包括东北生态区和南部平原与中部平原的边界,这些区域存在空间信息整合后的预测人工制品(图S9)。"低置信度"预测仅限于东南生态区,该生态区依赖于网格级训练数据,以及数据缺乏的奥扎克复合区和大西洋新热带生态区(图S9)。

土壤总碳含量作为降解EFC丰度的指标,我们的分析表明,土壤C含量的增加(最高到5%–10%)支持了EFC_Carbohydrate、EFC_Lignin、EFC_MonomerN、EFC_InorganicN和EFC_MonomerP的丰度,但降低了EFC_OrganicP的丰度。这种土壤C对EFC丰度的正效应与先前的酶活性实验结果一致,这些实验表明土壤C含量与碳水化合物分解和单体N和P矿化酶的活性之间存在强正相关。这一发现强调了土壤总C含量反映有机底物的更高可用性,从而促使微生物群落潜在合成更多基因编码酶以获取能量和营养(Allison & Vitousek, 2005)。随着土壤C含量的增加(到5%–10%),EFC_MonomerP的增加和EFC_OrganicP的减少可能表明单体有机P的可用性增加,促使微生物群落合成EFC_MonomerP以获取简单有机P底物中的P。

除了土壤C含量,我们还发现土壤C/N比和NPP对EFC丰度的调控反映了微生物群落在养分限制下的资源优化策略。土壤C/N比在10以下时与EFC_Carbohydrate、EFC_Lignin、EFC_MonomerN、EFC_InorganicN和EFC_InorganicP的丰度相关,这可能是因为这些土壤C/N比与典型微生物C/N比(Cleveland & Liptzin, 2007; Xu et al., 2013)以及土壤C含量低于10%相符。在这一肥沃环境中,EFC丰度更依赖于土壤C含量,如第4.2节所述。相比之下,土壤C/N比高于10的土壤可能表明微生物群落面临养分限制。随着土壤C/N比的进一步增加,与有机C和P分解、N和P矿化相关的基因编码酶丰度增加,但与将无机N转化为气体形式相关的基因编码酶丰度减少。这种土壤C/N比的主要效应在土壤C/N比高于20时更为显著,特别是对EFC_OrganicP、EFC_MonomerN和EFC_MonomerP。土壤C/N比高于10的土壤通常出现在温带森林生态系统(Xu et al., 2013)中,具体是N或P限制取决于土壤类型和大气N沉降水平(Adams et al., 2019; Du et al., 2023)。我们的研究结果表明,增加的养分限制可能促使微生物群落合成更多酶以获取养分和能量,同时减少与无机N转化为气体形式相关的酶的合成。这些发现与我们之前的研究(Yao et al., 2018)一致,并支持资源优化理论,即微生物群落调整基因编码酶的合成以应对不同环境下的养分限制。

除了土壤C/N比,NPP对EFC_Lignin、EFC_OrganicN、EFC_MonomerP和EFC_InorganicN的丰度也有显著影响。然而,这些EFC丰度随NPP变化的趋势在不同MAP区域有所差异。当年均NPP从100增加到400克C/平方米时,低MAP区域(MAP≤1,000毫米/年)的EFC_Lignin丰度下降。此外,当年均NPP从400增加到800克C/平方米时,无论MAP如何,EFC_InorganicN和EFC_MonomerP的水平均下降。在NPP超过800克C/平方米的土壤中,较高的NPP支持更高的EFC_OrganicN丰度。这些NPP在不同MAP区域的影响揭示了植物落叶和根系分泌物对获取能量和养分的EFC的联合作用(图5c)。先前的酶活性实验(Ai et al., 2023; Weintraub et al., 2013)表明,增加的落叶输入通过提供难分解的底物提高了降解酶的活性。另一方面,增加的根系分泌物(如易分解的底物、磷酸酶、有机酸和其他代谢物)减少了微生物对能量和P获取的酶合成,增加了对N获取的微生物投资(Beidler et al., 2021; Martins et al., 2021)。我们的研究结果表明,微生物群落根据整合的植物影响优化资源,增加的根系分泌物减少了EFC_Lignin、EFC_MonomerP和EFC_InorganicN的丰度,而落叶输入则驱动基因编码酶的合成以获取植物来源的有机N和难分解的C(图5c)。

土壤质地对EFC丰度的调控反映了微生物群落在土壤中选择性有机-矿物结合下的资源优化策略。我们的研究结果(图5d)表明,细粒土壤(低沙粒含量)通常比粗粒沙质土壤具有更高的EFC_OrganicN、EFC_MonomerN和EFC_InorganicP丰度。沙质-黏土和黏土土壤中的较高黏土含量也支持较高的EFC_MonomerP丰度。这些结果归因于细粒土壤的高阳离子交换容量(CEC)和小孔隙结构,这使它们能够通过吸附和/或聚集保留更多的有机和无机养分,与沙质土壤相比(Gérard, 2016; Hassink et al., 1993)。这种养分保留可能促使微生物群落合成更多基因编码酶以获取有机N和P来源的养分。我们的研究结果支持Spohn等人(2024)的观点,即有机N和P(尤其是磷酸单酯)通常比无养分的土壤有机质(SOM)具有更高的对矿物表面的吸附亲和力,这是由于它们的高电荷密度和与矿物的官能团结合。我们对细粒土壤中基因编码酶合成增加以获取有机N和P来源养分的发现,为Spohn(2024)关于在N或P限制土壤中,与矿物结合的有机质可能比在N和P可用性更高的土壤中矿化更快的假设提供了基因层面的解释。我们的研究强调了土壤黏土矿物和相关有机质含量作为关键中介因子在养分矿化中的作用(Jilling et al., 2018; Zhang et al., 2022)。

气候对EFC丰度的调控反映了微生物群落在气候压力下的资源优化策略。我们的研究结果表明,微生物群落倾向于在MAP低于1,300毫米的区域合成较少的基因编码酶以获取C和P,以及进行无机N转化和P同化。这可能是因为水压力限制了分解产物的扩散(Li & Sarah, 2003; Sardans & Pe?uelas, 2005)。为了应对这种水限制对微生物合成酶获取土壤底物的可及性,微生物群落可能增加与细胞渗透压和休眠相关的基因编码酶的合成(Bouskill et al., 2016; Malik & Bouskill, 2022; Malik et al., 2020; Schimel et al., 2007)。尽管土壤微生物群落对水限制的具体响应机制可能因降水频率和强度而异,但我们的研究首次系统地表明,在水限制条件下,
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号