揭示中国东北地区土壤氮矿化潜力的空间分布特征:一项结合实验验证的元分析研究
《Geoderma》:Unveiling spatially explicit soil nitrogen mineralization potential in Northeast China: A meta-analysis coupled by experimental validation
【字体:
大
中
小
】
时间:2025年11月21日
来源:Geoderma 6.6
编辑推荐:
氮矿化潜力区域数据库构建与机器学习模型开发;东北中国水稻土氮供应能力评估;多池动力学模型优化;土壤质地与CEC主导因子;XGBoost模型与空间异质性;精准施肥决策支持。
在东北中国,水稻种植系统依赖于相对有限的氮肥投入,却表现出较高的氮利用效率(NUE),这使得土壤本身的氮供应能力成为维持该地区水稻生产可持续性的关键因素。研究指出,氮矿化潜力(Nmp)是土壤氮供应能力的核心,然而其区域行为和控制因素尚未得到充分研究。为了填补这一知识空白,本研究整合了15项同行评审的文献数据,并结合了对24种代表性稻田土壤的培养实验,构建了首个区域性的Nmp数据集。通过对Nmp的动态-动力学拟合分析,发现混合动力学模型能够描述超过80%的培养曲线,得出整个区域的平均Nmp为113 mg N kg?1。利用深度学习回归、排列重要性分析和SHAP(SHapley Additive exPlanations)方法,我们识别出砂含量、阳离子交换量(CEC)、总氮(TN)、总有机碳(TOC)以及生长积温(GDD)是Nmp的主要预测因子。最终的模型,基于文献和实验数据共同训练,能够解释59%的Nmp变异(RMSE = 36.4),并成功地将Nmp上推至250米分辨率的网格地图,揭示了东北中国水稻种植区中“南北高、中部低”的显著空间格局。本研究提出了一种结合元分析、基于过程的动力学模型与可解释机器学习的综合工作流程,为东北中国这一中国最重要的水稻产区之一提供了透明且空间明确的土壤氮供应能力评估工具。这一空间明确的基础为考虑土壤可矿化氮储量的定点氮肥管理提供了实践途径,进而构建出结合经济和社会因素的针对性决策。
东北中国的水稻种植区(北纬38°至53°,东经118°至135°)横跨黑龙江、吉林和辽宁三省以及内蒙古东部四盟。该区域的水稻种植区包括温带和寒温带,夏季短暂且温暖,冬季漫长且寒冷,降雨主要集中在夏季。年平均温度为5至11℃,年平均降水量为500至800 mm。东北地区的水稻种植系统以单季种植为主,生长季节从5月到10月。主要土壤类型包括黑钙土、褐土、淋溶土、钠影响的淋溶土(即碱性土)和灰化土。该地区以单季作物种植为主,水稻、玉米、小麦和大豆是主要的农作物。尽管黑土区覆盖整个东北地区,但水稻种植主要集中在黑龙江、吉林和辽宁的水资源丰富的区域。
为构建Nmp数据库,我们使用Web of Science和中国知网(CNKI)数据库,检索了截至2024年10月发表在同行评审期刊上的相关研究。初步搜索使用关键词“氮矿化”或“N mineralization”、“稻田土壤”或“水稻”、“东北中国”、“三江平原”、“松嫩平原”、“辽河平原”、“黑龙江”、“吉林”或“辽宁”,共检索到44篇文献。经过人工筛选,保留了12篇符合纳入标准的研究。在Dimensions数据库中,使用相同的关键词进行第二次检索,得到了142篇文献,其中四篇通过摘要筛选进一步纳入数据库。在CNKI中,为了适应中文索引和地名变体,我们首先使用更广泛的术语如“稻田土壤”、“氮矿化”和“氮供应”,然后在标题、摘要和全文筛选中限定为东北地区,共获得107篇文献。经过标题和摘要筛选,最终确定了15篇来自东北地区的研究符合元分析的纳入标准。在选择数据时,我们排除了重复项,并遵循以下标准:(1)仅纳入针对东北地区稻田土壤的实验室厌氧培养实验;(2)需报告培养期间的氮矿化量;(3)研究地点需位于东北地区。同一研究中的不同年份被视为独立观测。此外,数据需包含每个试验处理的试验重复次数和平均产量信息。若同一实验在不同论文中出现,则仅纳入一次。数据库构建过程如图示流程(图S1)所示。
从每篇文献中,我们数字化了培养时间及对应的累积矿化氮含量,并记录了报告的土壤性质、培养方案和培养温度。当数值在表格中出现时,我们直接转录;若仅在图表中出现,则使用OriginPro 2025数字化工具进行提取。数字化序列与文本或表格中报告的均值或终点进行了交叉核对。培养温度被归一化为生长积温(GDD),基于东北地区水稻生长的平均周期(图S1),并使用了公式(1)进行计算。对于未报告完整土壤理化性质的研究,我们从统一世界土壤数据库(HWSD,FAO;1 km空间分辨率)中补充了缺失变量,包括pH值、总氮(TN)、总有机碳(TOC)、容重、阳离子交换容量(CEC)以及黏粒含量(CEC黏粒)和粒径组成(黏土、粉砂和砂含量)。
为了进行空间扩展,我们整合了包括250米分辨率的土壤TN、TOC、总磷(TP)、总钾(TK)、pH值、CEC以及黏土和砂含量的网格化协变量(Liu et al., 2022b);一个1 km分辨率的CEC黏土图层(FAO和IIASA, 2023);单季水稻的物候历(Luo et al., 2020);2020年单季水稻分布图(Shen et al., 2023);以及每日气温数据(CMA, 2020)。这些网格化协变量作为Nmp建模框架的输入。所有环境协变量均被重新采样至250米分辨率。每个网格单元的GDD计算公式为:GDD = ∑i=1n max[0, Tave,i - Tbase],其中Tave,i为每日平均温度,Tbase = 10℃为水稻基温(Liu et al., 2022c),n为当地的水稻生长季节长度。
我们进行了培养实验,采集了24个表层稻田土壤样本(0–20 cm),并在2022年9月进行。在每个采样点,我们从稻田中取5个核心样本,去除地表枯枝落叶后,混合成一个样本。这些样本被送回实验室,风干后用2 mm筛进行物理化学性质分析。混合后的样本被密封在聚乙烯袋中,存放在保温箱内(4℃),并在48小时内运送到实验室。在实验室中,样本被手工挑选以去除可见的根系和砾石,然后充分混合并分成两个子样进行物理化学性质分析和培养实验。我们采用了两种培养制度:短期培养(28天)在20℃下进行,长期培养(112天)在30℃下进行。每个土壤样本称重10.00 g,加入25 mL去离子水,形成三重复的土壤-水悬浮液。对于短期(20℃)培养,其中8个土壤样本在20℃下培养。在培养的第1、3、7、14、21和28天,进行破坏性采样,测定土壤中的NH4+-N含量。对于长期(30℃)培养,所有24个土壤样本均在30℃下培养。在第1、3、5、7、14、21、28、42、56、70、91和112天进行采样,并按照相同协议分析NH4+-N含量。土壤pH值在固液比1:2.5(w/v)下测定,使用pH离子浓度-电导率多参数测试仪(SG78,Mettler Toledo,瑞士)。土壤总氮(TN)和总有机碳(TOC)通过燃烧法测定,使用C & N Analyzer(Skalar Analytical,荷兰)。TOC与TN的比值即为碳氮比(C/N)。NH4+-N通过2 mol L?1 KCl提取,并使用Skalar Analytical的流式分析仪测定。土壤阳离子交换容量(CEC)通过改良的NH4-乙酸强制置换法测定(Gaskin et al., 2008)。
在模型选择过程中,我们使用了R语言进行数据合成,采用了Tukey HSD检验(用于正态分布数据)和Wilcoxon检验(用于非参数数据)对不同组别(数据来源、省份:黑龙江、吉林和辽宁)的土壤理化性质、氮矿化模型参数和Nmp进行多重均值比较。方法框架如图2所示。
为了构建Nmp预测模型,我们使用了六种广泛使用的算法,包括普通最小二乘法(LM)、广义线性模型(GLM)、广义加性模型(GAM)、带惩罚的广义线性模型(GLMNet)、随机森林(RF)和极端梯度提升(XGBoost)。这些算法分别属于线性、半参数、正则化和树集成模型。LM提供了一个透明的基线比较;GLM(高斯分布,单位链接)代表了一个参数化替代方案;GAM(薄板回归样条)允许平滑的非线性效应,并具有可解释的偏依赖;GLMNet(弹性网络)处理多重共线性和特征选择;RF和XGBoost则捕捉土壤-气候-管理系统的非线性关系和交互作用。所有分析均在R(v4.5.0)中进行,使用stats(LM/GLM)、mgcv(GAM;REML平滑选择)、glmnet、ranger和XGboost等包。每个模型均通过十折交叉验证进行训练,并通过RMSE、R2和AIC来评估其性能。RMSE作为模型选择的主要指标。
在模型性能评估中,我们发现XGBoost模型在交叉验证中表现最佳,其RMSE为12.1 mg N kg?1,R2为0.74。排列重要性分析显示,五个主要预测因子为TN、TOC、CEC、GDD和C/N比。TN是最重要的预测因子,随机化TN后,模型的RMSE增加了68.5 mg N kg?1。TOC(22.8 mg N kg?1)、CEC(20.4 mg N kg?1)、GDD(16.7 mg N kg?1)和C/N比(15.9 mg N kg?1)的重要性次之,而黏土/TOC比、pH值、黏土含量、TK和NO3–-N的贡献均小于10 mg N kg?1。通过SHAP(SHapley Additive exPlanations)方法进一步量化了预测因子的影响和方向性,提供了对模型中个体环境控制因素的无偏解释。
为了验证Nmp模型的准确性,我们将XGBoost模型应用于24个实验土壤样本。结果发现,一半的样本落在与1:1线接近的“良好拟合”组(R2 = 0.35,RMSE = 72.9 mg N kg?1),另一半则偏离(R2 = 0.09)(图6C)。对这两个组别土壤性质的比较显示,良好拟合样本的多变量空间与训练数据集一致,特别是对于三个最重要的预测因子(图S4)。良好拟合组的黏土/TOC比、TN和TOC的均值分别为1.11、2.09 g kg?1和27.36 g kg?1,这些均值与训练数据集无显著差异。相比之下,较差拟合样本的黏土/TOC比显著降低(0.62),TN和TOC显著升高(3.63 g kg?1和48.64 g kg?1),这表明较差拟合样本的土壤性质超出了模型校准域的密度范围,迫使算法进行超出其学习响应面的外推,从而降低了预测准确性。这些偏差提醒我们,需要新的培养实验来针对未充分代表的土壤样本,尤其是南方辽宁逐渐变暖的边缘地区(Fang et al., 2025),以减少“域外”不确定性。
通过将元分析数据集与24个实验土壤样本相结合,我们证明了仅依赖文献数据的局限性。一个仅基于元数据训练的XGBoost模型在“域外”土壤中(这些土壤在质地和养分状态上有所不同)高估了可矿化氮含量,最高可达40%(图7)。类似的结果已在其他生态模型中观察到,这些模型过于灵活或数据有限且变异大(Chollet Ramampiandra et al., 2023)。结合两个数据集的混合XGBoost框架为东北中国提供了最准确的区域Nmp预测,同时通过排列重要性和SHAP诊断保持了模型的可解释性。尽管该混合XGBoost模型显著提升了预测能力,但它继承了所有数据驱动方法的基本局限性:一旦目标地点的协变量组合超出训练所用的环境尺度,预测不确定性将迅速增加。因此,减少这种“域外”不确定性需要新的培养实验,特别是针对未充分代表的土壤样本,尤其是南方辽宁逐渐变暖的边缘地区。
Nmp地图的生成和应用为水稻种植区的精准氮肥管理提供了科学基础。通过将Nmp转化为季节尺度的土壤氮供应项,该地图可以直接用于现有的养分平衡算法,指导省域和田级的氮肥管理。此外,该研究提出的综合工作流程为全球范围内的动态土壤过程整合到精准养分管理中提供了一个可转移的蓝图。尽管目前的Nmp地图在指导精准季节施肥时间方面存在一定的局限,但其在提供空间明确的土壤氮供应能力信息方面具有重要的农业价值。通过结合土壤测试提供的即刻植物可利用氮形式信息,以及Nmp地图提供的季节性有机氮供应项,两种方法可以相辅相成,而非相互竞争。土壤测试能够提供特定田块的即时养分信息,而Nmp地图则补充了土壤测试无法捕捉的季节性有机氮供应。此外,由于Nmp地图具有网格化特征,它可以在常规土壤测试稀缺的区域中预先填充决策支持工具。需要强调的是,本研究中开发的高分辨率Nmp图集为精准氮管理提供了空间明确的科学基础,而不是直接的决策指南。有效的田间氮管理策略必须将这种生物地球化学基础与社会经济因素相结合,如氮肥的成本效益分析、农民的风险承受能力和实际偏好,以形成具有针对性和可采纳的建议。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号