用于预测农田土壤中可利用镉含量的多重图融合神经网络
《Environmental Pollution》:Multigraph fusion neural network for predicting available cadmium levels in farmland soils
【字体:
大
中
小
】
时间:2025年10月10日
来源:Environmental Pollution 7.3
编辑推荐:
有效镉污染预测;多图融合神经网络;空间异质性;地理因子;土壤健康;机器学习模型优化;空间效应整合;重金属生物有效性;环境驱动机制;预测精度提升
在当今社会,土壤污染已成为全球性环境问题之一,其中重金属污染尤为严重。镉(Cd)作为一种典型的重金属污染物,因其对人体健康的潜在威胁和对生态环境的破坏性,受到广泛关注。镉污染主要来源于工业活动、矿产开采以及农业集约化发展,尤其是在一些特定的地理区域,如矿产开采区周边,镉的浓度往往远高于自然背景值。此外,镉的生物可利用性及其在食物链中的富集特性,使其对农业土壤和食品安全构成显著风险。因此,开发一种能够准确预测农业土壤中镉可利用浓度的模型,对于制定有效的土壤修复策略和保护生态环境具有重要意义。
当前,许多现有的模型在预测土壤中镉可利用浓度时,主要依赖于对多个环境和地理变量的简单汇总,这种做法通常忽略了这些变量之间的复杂相互作用以及地理因素的空间效应。这种局限性使得模型在面对具有高度空间异质性的镉污染分布时,预测效果不够理想。因此,研究者们开始探索更先进的机器学习方法,以提高预测的准确性和稳定性。例如,随机森林(RF)和极端梯度提升(XGBoost)等树模型因其对非线性关系的捕捉能力,已经被广泛应用于土壤重金属浓度的预测。此外,多层感知机(MLP)作为一种神经网络模型,也因其能够同时考虑环境因素的非线性效应和变量之间的相互作用而受到关注。然而,这些模型在输入特征的选择上仍然较为单一,通常仅基于土壤环境属性和空间变量,未能充分考虑地理因素的空间结构及其对镉分布的影响。
近年来,图神经网络(GNNs)作为一种能够有效捕捉空间关系和变量间非线性交互的模型,逐渐被引入到土壤重金属浓度预测的研究中。GNNs通过在复杂网络结构中聚合中心节点及其邻近节点的信息,能够更好地模拟空间相互作用。例如,一些研究者利用GNNs构建了环境因素与土壤重金属浓度之间的相关图,从而提高了预测精度。然而,这些研究在空间因素的考虑上仍然存在不足,未能充分整合多维的空间特征,这在一定程度上限制了模型对复杂环境驱动因素的捕捉能力。
为了解决上述问题,本研究提出了一种基于采样点与地理因素之间空间关系的多图融合神经网络模型。该模型通过构建多种空间关系图,如采样点与地形、矿产、道路和河流之间的关系图,来整合多维空间信息。随后,采用卷积神经网络(CNN)算法对这些不同的空间图进行融合,从而捕捉土壤环境变量对镉可利用浓度的非线性影响以及环境因素与地理因素之间的复杂相互作用。这种方法不仅能够提升模型的预测性能,还能更全面地反映土壤镉污染的空间异质性。
为了验证该模型的有效性,研究者还选择了四种单图神经网络模型和多个基线模型进行对比分析。结果显示,多图融合模型在预测土壤镉可利用浓度方面显著优于其他模型,其决定系数(R2)达到了0.82,均方根误差(RMSE)为0.0338 mg·kg?1,平均绝对误差(MAE)为0.0249 mg·kg?1。此外,与单图模型和基线模型相比,多图融合模型的残差分布范围更小,预测性能更加稳定。这些结果表明,将地理因素的空间效应纳入模型设计中,有助于提高土壤镉可利用浓度预测的准确性,并为理解农业土壤中重金属污染的空间异质性提供了有价值的分析工具。
本研究的地理区域位于中国湖南省的北部至中部地区,其地理坐标范围为111°40′33″–111°49′17″E和27°59′3″–28°6′16″N(图1)。该区域地处湘江流域、资水河中游以及雪峰山脉的北段,地形多样,属于亚热带季风气候区,年均温适中。研究区的土壤镉可利用浓度在0.01至0.49 mg·kg?1之间波动,平均值为0.16 mg·kg?1,标准差为0.07 mg·kg?1,变异系数为0.42,显示出明显的空间变化。同时,土壤总镉浓度的范围为0.08至1.69 mg·kg?1,平均值为0.43 mg·kg?1,标准差为0.22 mg·kg?1,变异系数为0.50,进一步表明该地区土壤中镉污染的复杂性。
在分析土壤环境因素对镉可利用浓度的影响时,研究发现土壤理化性质(特别是pH值和土壤有机质含量)与镉可利用浓度之间存在密切关系。例如,土壤pH值与镉可利用浓度呈负相关,这与以往的研究结果一致。随着pH值的升高,土壤中的H?离子浓度降低,从而减少了氢氧化物和碳酸盐的溶解度,抑制了镉离子的释放。此外,土壤有机质含量对镉的吸附和固定能力具有重要影响,其含量越高,镉的生物可利用性越低。这些发现为理解镉污染的形成机制提供了重要依据,并有助于优化模型的输入特征选择。
在模型构建过程中,研究者还考虑了多种地理因素对镉分布的影响,包括地形、矿产、道路和河流等。这些因素在不同空间尺度上对镉的迁移、富集和分布产生重要影响。例如,地形高差可能影响镉的垂直迁移和扩散路径,而矿产开采活动则可能导致镉的局部富集。道路和河流等线性地理要素则可能通过地表径流和沉积作用影响镉的分布格局。通过构建这些地理因素的空间关系图,并将其与土壤环境变量进行融合,模型能够更全面地捕捉镉污染的多因素驱动机制。
在模型训练和验证阶段,研究者采用了多种评估指标,包括R2、RMSE和MAE等,以量化模型的预测性能。同时,模型的稳定性也被考虑,通过分析残差分布范围,研究者发现多图融合模型在不同区域的预测误差相对较小,表现出更高的稳定性。这些结果表明,该模型不仅能够提供较高的预测精度,还能在不同地理环境下保持一致的性能表现,这对于实际应用具有重要意义。
此外,本研究还探讨了多图融合模型在不同环境条件下的适用性。通过对比不同地理区域的预测结果,研究者发现该模型在高镉污染区域和低镉污染区域均表现出良好的预测能力。这表明,该模型能够适应不同空间异质性的环境条件,为镉污染的区域化管理和预测提供了有力支持。同时,模型的可解释性也得到了关注,通过分析各图的贡献度,研究者能够识别出哪些地理因素对镉污染的预测具有更大的影响,从而为政策制定和环境治理提供科学依据。
在实际应用中,多图融合模型可以用于快速评估农业土壤中镉污染的风险,特别是在大规模区域调查和环境监测中。该模型不仅能够提高预测的准确性,还能减少对大量实地采样数据的依赖,从而降低监测成本和时间。此外,该模型还可以与现有的土壤污染评估体系相结合,为土壤修复和管理提供更精细化的决策支持。例如,在镉污染严重的区域,可以通过模型预测污染扩散趋势,为污染源控制和修复工程的规划提供参考。
为了确保模型的可靠性和泛化能力,研究者还进行了多次实验和验证。通过交叉验证和独立测试集的评估,模型在不同数据集上的表现均保持稳定,显示出较强的鲁棒性。同时,研究者还对模型的参数进行了优化,以提高其在不同环境条件下的适应能力。例如,通过调整图的构建方式和卷积神经网络的结构,模型能够更好地捕捉镉污染的复杂空间模式。
综上所述,本研究提出了一种基于多图融合的神经网络模型,用于预测农业土壤中镉的可利用浓度。该模型通过整合多种空间关系图,能够更全面地反映镉污染的多因素驱动机制,从而提高预测的准确性和稳定性。研究结果表明,多图融合模型在预测性能上显著优于其他模型,为镉污染的区域化管理和环境治理提供了新的思路和方法。未来的研究可以进一步探索该模型在其他重金属污染预测中的应用,并结合更多的环境和社会经济因素,以提高模型的综合预测能力。此外,随着遥感技术和地理信息系统(GIS)的发展,模型还可以结合更高分辨率的空间数据,为镉污染的精细化监测和管理提供更强大的技术支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号