基于机器学习框架预测与评估稻田土壤重金属污染的研究进展

【字体: 时间:2025年02月26日 来源:Heliyon 3.4

编辑推荐:

  为精准预测稻田土壤重金属污染,研究人员开发了一种基于机器学习模型的通用方法论框架,成功预测了湖南地区稻田土壤中多种重金属的分布,并揭示了主要驱动因素,为土壤污染防控提供了重要依据

  随着工业化和农业活动的加剧,稻田土壤重金属污染已成为全球性环境问题。湖南作为中国重要的水稻产区,稻田土壤重金属污染问题尤为突出。为精准预测和评估稻田土壤重金属污染的分布及其驱动机制,研究人员开发了一种基于机器学习模型的通用方法论框架。该研究以湖南湘潭县为研究区域,运用随机森林(Random Forest,RF)、额外树回归(Extra Trees Regressor,ETR)、极端梯度提升回归(Extreme Gradient Boost Regression,XGBR)和梯度提升回归树(Gradient Boosting Regression Tree,GBRT)等机器学习算法,结合多种环境变量,成功预测了稻田土壤中砷(As)、镉(Cd)、铬(Cr)、铜(Cu)、汞(Hg)、镍(Ni)、铅(Pb)和锌(Zn)等8种重金属的分布,并揭示了不同重金属污染的主要驱动因素。研究结果表明,79.8%的研究区域为中度污染,20.2%为重度污染,且污染程度呈现由西向东加重的趋势。该研究为湖南地区稻田土壤重金属污染的精准防控和土壤保护提供了重要的科学依据,并为其他地区的土壤污染研究提供了可借鉴的方法论框架。研究成果发表于《Heliyon》期刊。
研究背景: 稻田土壤重金属污染对生态环境和人类健康构成严重威胁。重金属具有不可降解性、毒性和持久性,其在土壤中的过量积累不仅会破坏自然生态系统,还会通过食物链传递影响人类健康。湖南作为中国重要的水稻产区,由于地质、气候条件以及人类活动的影响,稻田土壤重金属污染问题尤为突出。然而,目前对于稻田土壤重金属污染的研究多集中于污染源解析,缺乏对其空间分布和驱动机制的精准预测。因此,开发一种能够精准预测稻田土壤重金属污染的方法对于大规模监测和污染源识别具有重要意义。
为解决这一问题,中国科学院地理科学与资源研究所的研究人员联合中国农业科学院农业环境与可持续发展研究所、蒙古国科学院等机构,开展了基于机器学习模型的稻田土壤重金属污染预测与评估研究。研究团队以湖南湘潭县为研究区域,收集了包括土壤属性、光谱指数、气象和社会经济因素在内的18个变量数据,并运用RF、ETR、XGBR和GBRT等机器学习算法,构建了重金属污染预测模型。通过模型预测和评估,研究人员成功揭示了研究区域稻田土壤重金属污染的空间分布特征及其主要驱动因素。
研究方法: 研究人员首先对研究区域进行了详细的土壤采样和实验室分析,获取了稻田土壤中8种重金属的实际含量。同时,收集了包括土壤质地、土壤有机碳含量、土壤含水量等土壤属性数据,以及从Sentinel卫星数据中提取的光谱指数、ERA5-Land再分析数据集中的气象数据和社会经济数据。所有数据经过标准化处理后,用于构建机器学习模型。
在模型构建过程中,研究人员采用了RF、ETR、XGBR和GBRT四种基于决策树的机器学习算法。通过预建模阶段的特征筛选和模型选择,确定了适合的输入特征和算法。最终,通过10折交叉验证和误差指标评估,确定了最优模型。此外,研究人员还运用SHAP(SHapley Additive exPlanations)技术对模型输出进行了解释,揭示了各输入特征对模型输出的贡献。
研究结果:
  1. 重金属污染的空间分布: 研究结果显示,湖南湘潭县稻田土壤中Cd污染最为严重,其次为Zn。通过机器学习模型预测,研究区域79.8%的面积为中度污染,20.2%为重度污染,且污染程度呈现由西向东加重的趋势。Yisuhe镇等人口密集的城镇区域受到Pb、Cd和Hg污染的影响尤为显著。
  2. 重金属污染的主要驱动因素: 通过特征重要性和SHAP分析,研究人员发现土壤属性(如土壤有机碳含量、土壤质地)、气候因素(如气温、露点温度)以及社会经济因素(如人口密度、道路密度)对重金属污染的预测具有重要贡献。例如,对于As污染的预测,露点温度(dewt)贡献了42.14%,有机碳密度(OCD)贡献了13.84%,红度指数(RI)贡献了12.89%。而对于Cd污染的预测,气温(t2m)贡献了21.62%,露点温度贡献了10.81%。
  3. 机器学习模型的性能: 在所有模型中,RF模型在预测As、Cr、Cu和Hg浓度方面表现最佳,ETR模型在预测Cd、Zn和Pb浓度方面表现较好,而GBRT模型在预测Ni浓度方面表现最佳。例如,RF模型预测Cr浓度的决定系数(R2)为0.746,均方根误差(RMSE)为16.157;ETR模型预测Cd浓度的R2为0.521,RMSE为0.24。
研究结论与讨论: 该研究通过机器学习模型成功预测了湖南湘潭县稻田土壤重金属污染的空间分布,并揭示了其主要驱动因素。研究结果表明,气候因素和土壤属性对重金属污染的预测具有重要影响,这为未来进一步研究气候变化与土壤重金属污染之间的关系提供了新的视角。此外,该研究开发的通用方法论框架为其他地区的土壤污染研究提供了可借鉴的思路和方法。然而,研究也存在一定的局限性,如数据的空间分辨率差异、未考虑土壤母质和人类活动的某些因素等。未来的研究可以通过纳入更全面的数据和采用更多样化的模型来进一步提高预测精度。总体而言,该研究为湖南地区稻田土壤重金属污染的精准防控和土壤保护提供了重要的科学依据,并为全球土壤污染研究贡献了新的方法和技术支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号