数据融合通过使用高精度的地表建模技术,提高了土壤有机碳估算的准确性
《Soils and Foundations》:Data fusion enhances the accuracy of soil organic carbon estimation by using high accuracy surface modeling
【字体:
大
中
小
】
时间:2025年11月07日
来源:Soils and Foundations 3.3
编辑推荐:
多源数据融合与机器学习结合提升土壤有机碳预测精度,通过环境变量、光学遥感和SAR数据,采用SVM、随机森林和XGBoost算法,结合高精度表面建模(HASM),显著提高SOC估算的R2和降低RMSE,修正空间分布偏差,为全球尺度碳估算提供新方法。
土壤有机碳(SOC)作为全球陆地生态系统中最大的碳库,占据了总陆地碳储量的50%-80%。其含量的微小变化都可能对大气中二氧化碳浓度产生显著影响,进而影响全球气候变化和碳循环。此外,SOC的变化还对作物生长和粮食安全具有重要影响。因此,准确地绘制SOC的空间分布图,对于制定有效的陆地碳封存策略至关重要。然而,目前在多源数据的协同应用及其对模型估计精度的影响方面,仍存在较大的研究空白。这种空白限制了我们对土壤碳库的准确评估能力。
为了填补这一空白,本研究提出了一种数据-模型融合框架,该框架结合了三种类型的多源数据——环境变量、光学遥感数据和合成孔径雷达(SAR)数据,并使用了三种机器学习算法来预测SOC。研究中采用了高精度地表建模(HASM)方法,对SOC实地观测数据和模型模拟数据进行了融合。HASM是一种基于优化控制和地表理论的数据融合方法,已在多种生态建模领域得到了成功应用。在本研究中,HASM不仅提高了模型的模拟精度,还优化了SOC的空间分布模式,修正了之前低估和高估的SOC含量区域。
实验结果表明,结合所有三种数据类型的组合,与仅使用单一数据类型的模型相比,预测精度得到了显著提升。具体而言,使用支持向量机(SVM)、随机森林(RF)和极端梯度提升(XGBoost)模型时,R2值增加了4%-53%,而均方根误差(RMSE)则降低了18%-25%。这说明多源数据的融合能够有效提升SOC预测的准确性。此外,通过HASM进行数据融合后,模拟精度进一步提高,R2值增加了18%-22%,RMSE降低了2%-12%。同时,SOC的空间分布模式也变得更加合理,有助于更准确地识别SOC含量较高的区域以及需要关注的低SOC含量区域。
本研究还发现,在高山生态系统中,传统的SOC估算方法存在一定的局限性。由于高山地区土壤采样点稀疏,且自然条件恶劣,如高海拔、复杂地形和极端气候,这些因素使得SOC的准确估算变得更加困难。在这样的环境中,依赖于单一数据源的模型往往难以捕捉SOC的复杂变化。因此,研究团队选择了青藏高原上的兴海县作为研究区域,以测试以下假设:(1)多源数据驱动的机器学习算法在SOC估算中的准确性高于单一数据类型的模型;(2)引入SAR数据可以提升SOC估算的准确性,并增强其在复杂地形中的适用性;(3)使用HASM进行数据融合可以实现SOC空间分布的最佳预测。
兴海县位于中国青海省南部的三江源地区东北部,地理坐标为东经99°01′-100°21′,北纬34°48′-36°14′。该地区的海拔范围从2600米到5320米,平均海拔为4200米。兴海县总面积约为12,100平方公里,人口约75,833人。该地区具有典型的高山大陆性气候,表现为强烈的太阳辐射、显著的温度变化和恶劣的热环境。由于其独特的地理位置和自然条件,兴海县成为研究SOC变化及其与气候变化关系的理想区域。
在SOC的统计分析中,研究发现该地区的平均SOC含量为30.24克/千克,明显高于中国国家标准中SOC含量的第一类分类标准(23.2克/千克)。SOC的变异系数为45.35%,表明数据分布相对均匀。偏度值为1.22,表明SOC含量存在轻微的右偏,即较高的SOC值出现频率较低,而较低的SOC值较为常见。总体而言,SOC的分布模式呈现出一定的规律性,但仍然存在较大的空间异质性。
研究进一步探讨了影响SOC形成的驱动变量及其相对重要性。SOC的形成受到气候、地形、母质、生物因素(如植被、生物活动和土地利用)以及时间等多方面因素的影响。这些因素深刻地塑造了土壤的性质,并为数字土壤制图(DSM)提供了重要的理论基础。近年来,许多研究已经成功地将这些土壤形成因素与土壤采样数据相结合,以估算大范围内的SOC含量。在本研究中,降水、B8A波段等变量被证明对SOC的预测具有重要影响。
研究结果还表明,SAR数据的引入显著提升了SOC模拟的准确性。与仅使用环境变量或光学遥感数据相比,结合SAR数据的模型R2值增加了9%-21%,而RMSE降低了4%-34%。这说明SAR数据在SOC预测中具有独特的价值,尤其是在植被覆盖较为复杂的区域。SAR数据能够有效捕捉植被与土壤之间的相互作用,从而提供更全面的土壤信息。此外,研究还发现,HASM方法在SOC预测中表现出色,其融合能力使得模型能够更好地匹配观测数据,从而提高了预测的可靠性。
本研究不仅为SOC的准确估算提供了新的方法,也为全球和国家尺度的SOC预测提供了科学依据。通过将多源数据与先进的机器学习算法相结合,研究团队成功构建了一个能够有效提高SOC预测精度的模型框架。这种方法在高山生态系统中展现出良好的适应性,特别是在土壤采样点稀疏的地区。此外,HASM方法的应用进一步验证了其在优化模型参数和状态变量方面的有效性,从而提高了SOC空间分布预测的准确性。
总体而言,本研究强调了多源数据融合在SOC预测中的关键作用,并展示了机器学习算法在这一领域的巨大潜力。通过结合光学遥感、SAR数据和环境变量,研究团队不仅提升了SOC预测的精度,还更深入地理解了SOC的空间分布特征。这一成果为未来在类似复杂生态系统中进行SOC研究提供了重要的参考,并有助于推动全球范围内的土壤碳库评估工作。此外,研究还为制定更加科学和有效的陆地碳封存策略提供了理论支持和技术手段。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号