
-
生物通官微
陪你抓住生命科技
跳动的脉搏
中国土壤有机碳密度数据集(2010-2024):高分辨率建模与青藏高原碳汇评估
【字体: 大 中 小 】 时间:2025年08月26日 来源:Scientific Data 6.9
编辑推荐:
针对中国土壤有机碳(SOC)数据分辨率不足、青藏高原代表性缺失等问题,研究人员通过集成7,852个剖面23,103个样本,结合机器学习(EM)和土壤传递函数(PTF),构建了首个覆盖800 cm深度的全国SOC密度(SOCD)数据集。该成果为碳汇评估和气候政策提供了高精度数据支撑,发表于《Scientific Data》。
土壤是地球最大的陆地碳库,其中有机碳(SOC)的动态变化直接影响全球气候。中国作为碳排放大国,其土壤碳汇潜力对实现“2030碳达峰、2060碳中和”目标至关重要。然而,现有SOC数据存在三大痛点:青藏高原等关键区域样本稀缺、深层土壤(>100 cm)数据匮乏、 bulk density(BD)测量缺失导致SOC密度(SOCD)计算偏差。这些问题严重制约了国家尺度的碳评估精度。
为此,Zhongxing Chen等团队在《Scientific Data》发表了2010-2024年中国SOCD数据集。研究整合了国家土壤普查、开放数据库和82篇文献的23,103个样本,创新性地采用集成建模(Ensemble Modelling, EM)融合支持向量机(SVM)、随机森林(RF)等算法,预测缺失的BD值。通过Granger-Ramanathan加权框架,模型在验证集上达到BD预测R2=0.63、SOCD预测R2=0.83的精度,显著优于传统方法。
关键方法
数据整合:汇集7,852个剖面(含5,053个BD填补样本),覆盖全国气候带和青藏高原新数据;
环境变量:引入90m地形(SRTM)、1km气候(WorldClim)、30m植被指数(NDVI)等11类预测因子;
EM建模:通过SVM、Cubist、RF、GBM四模型加权优化BD预测;
SOCD计算:基于SOC含量、预测BD、土层深度和粗碎片比例(CF)按公式SOCD=SOC×BD×Depth×(1-CF)/100生成数据集。
研究结果
模型性能:EM方法将BD预测误差(RMSE)降至0.13 g cm-3,SOCD预测LCCC(Lin's一致性系数)达0.93;
垂直分布:数据延伸至800 cm深度,揭示深层碳库占总量37%(中值2.41 kg m-2);
空间特征:填补青藏高原数据空白,显示该区SOCD均值超全国水平(3.85 kg m-2)。
结论与意义
该研究创建了迄今最完整的中国SOCD数据库,其价值体现在三方面:
方法学突破:EM框架解决BD数据缺失难题,为全球土壤建模提供新范式;
政策支撑:高分辨率数据直接服务于国家碳交易和土地管理决策;
科学发现:证实青藏高原作为关键碳汇区的地位,修正既往低估。
作者在讨论中指出,未来可结合地理加权回归提升空间预测精度。数据集已开源(Zenodo DOI:10.5281/zenodo.15851730),代码公开于GitHub,推动土壤碳循环研究的可重复性发展。
生物通微信公众号
知名企业招聘