
-
生物通官微
陪你抓住生命科技
跳动的脉搏
加拿大100米土壤景观网格:基于机器学习的国家尺度数字土壤制图与碳储量评估新工具
【字体: 大 中 小 】 时间:2025年07月11日 来源:Scientific Data 5.8
编辑推荐:
本期推荐研究人员针对加拿大土壤数据不足问题,采用预测性土壤制图(PSM)技术,集成随机森林(RF)和分位数随机森林(QRF)算法,开发了全国首套100米分辨率土壤景观网格数据集。该研究实现了土壤有机碳(SOC)含量、容重(BD)等关键属性的高精度预测(R2达0.82),为碳储量评估和可持续土壤管理提供了重要数据支撑。
在全球气候变化背景下,土壤作为最大的陆地碳库,其精确测绘对碳循环研究和农业可持续发展至关重要。然而作为世界面积第二大的国家,加拿大长期面临土壤数据分辨率低、更新滞后的挑战——传统土壤调查耗时费力,现有数据多集中于南部农业区,且采样点分布不均(如图2所示)。这种数据缺口严重制约着精准农业、碳汇评估等关键应用。
针对这一难题,加拿大农业与农业食品部科技分支(Science and Technology Branch, Agriculture and Agri-Food Canada)的Xiaoyuan Geng团队在《Scientific Data》发表了突破性研究成果。研究人员整合全国土壤剖面数据和70种环境协变量,创新性地采用机器学习方法构建了加拿大首个100米分辨率土壤景观网格。这项研究不仅填补了国家尺度高精度土壤数据的空白,更建立了可定期更新的预测性土壤制图技术体系。
研究团队运用三大核心技术:1) 基于Ranger包的随机森林算法进行土壤属性预测,结合分位数随机森林(QRF)量化不确定性;2) 采用Zhang和Lu提出的偏差校正模型-1解决随机森林的条件偏差问题;3) 开发并行计算方案处理400个数据分块(如图3所示的瓦片系统),显著提升了大范围建模效率。
土壤属性预测模型性能
通过交叉验证显示,土壤有机碳(SOC)在0-30cm深度的预测R2达0.82,容重(BD)预测R2为0.70-0.73(表2)。特别值得注意的是,模型成功捕捉了加拿大典型土壤类型的空间分布规律,与1:100万比例尺土壤图(SLC)的整体一致性达62%(表3)。
独立验证结果
在曼尼托巴省Swan Lake等三个典型区域(图4)的独立验证中,100米网格数据与高分辨率土壤调查表现出显著相关性。例如SOC含量在土壤调查与10米网格间的Pearson相关系数达0.78(图6),证实了新数据集在区域尺度的可靠性。不过研究也发现,在田间尺度上仍存在砂粒含量预测偏差(表4),提示未来需要更高密度采样点优化模型。
深度校正创新
研究首次将全国基岩深度数据整合到土壤属性预测中,通过算法自动识别浅层土壤区域(深度<1米),显著提升了深层土壤属性预测的准确性。这一技术突破解决了传统土壤制图中普遍存在的"虚拟延伸"问题。
这项研究标志着加拿大土壤信息化迈入新阶段。100米土壤景观网格不仅可直接服务于国家碳清单编制(与全球250米网格相比,SOC储量相关性提升至0.49),更为土壤侵蚀评估、土地适宜性分析等应用提供了基础数据平台。研究者特别指出,该技术框架支持"滚动更新"机制——随着新增采样数据的不断积累,未来可通过增量学习持续提升模型精度。这种动态更新能力使其成为应对气候变化背景下土壤快速变化的理想工具。
成果的开放获取政策(CC BY 4.0许可)确保了数据的广泛可用性,配套提供的R代码库(https://github.com/CanSISPSM/PSM100mCanada)更为方法复现提供了便利。正如讨论部分强调的,这项工作不仅解决了加拿大本土的土壤数据需求,其技术路线对全球数字土壤制图(尤其是高纬度地区)也具有重要参考价值。未来研究将聚焦于提高模型在北方森林和苔原带的预测能力,以及开发面向终端用户的简化不确定性表达方式。
生物通微信公众号
知名企业招聘