利用同位素、光谱技术和傅里叶变换离子回旋共振质谱(FT-ICR MS)在非洪水季节研究主要入湖河流对戴耶湖(Lake Daye)中溶解有机物质的影响

《Journal of Hydrology》:Deciphering the impacts of main inflowing rivers on dissolved organic matter in Lake Daye using isotopes, optical spectroscopy, and FT-ICR MS during non-flood season

【字体: 时间:2025年08月21日 来源:Journal of Hydrology 6.3

编辑推荐:

  本研究提出基于外部注意力机制的集成学习模型EA-ensemble,融合XGBoost、RF、CNN、GRU和MLP五种子模型,利用MIC筛选关键外部变量(净太阳辐射、最高温、相对湿度等),在淮河流域五个站点实现1-28天ET?多步预测,NSE达0.99-0.60,MAPE降低50%-25%,并通过SHAP分析验证模型机理。

  本研究围绕参考蒸散发(ET?)的多步预测问题展开,旨在为农业生产管理提供更加精准的预测支持。参考蒸散发作为衡量理想作物蒸散发的重要指标,广泛应用于农业水资源分配和作物种植规划。ET?的准确预测不仅有助于理解水、能量和碳循环的动态变化,还能够为农业决策提供科学依据。因此,研究如何提高ET?的预测精度具有重要的现实意义。

目前,针对ET?的预测方法主要分为两类:一类是基于物理过程的计算方法,另一类是基于机器学习或深度学习的模型。其中,Penman-Monteith公式是被联合国粮食及农业组织(FAO)推荐的计算ET?的标准方法,它结合了气动力和热力学原理,广泛应用于不同气候条件下的区域。然而,随着数据复杂性的增加,单一模型在多步预测中的表现受到一定限制,难以满足不同时间尺度下的预测需求。为此,研究者尝试引入多种机器学习模型,如极端梯度提升(XGBoost)、随机森林(RF)、卷积神经网络(CNN)、门控循环单元(GRU)和多层感知机(MLP)等,以提高预测的准确性和稳定性。

在现有研究中,尽管已经尝试使用多种模型进行ET?预测,但多数方法仍局限于单一模型或简单的模型融合策略,如简单平均或加权平均。这些方法在处理多步预测任务时,往往无法有效平衡模型的预测能力和可解释性。因此,本研究提出了一种基于外部注意力机制的集成学习方法(EA-ensemble),通过引入外部注意力机制,对不同子模型的输出进行动态加权,从而实现更优的模型融合效果。

本研究选择中国淮河流域的五个站点作为案例,对ET?进行多步预测。淮河流域是中国重要的水稻种植区,拥有丰富的水资源和肥沃的土地,气候温和、光照充足、降雨量适中,非常适合水稻生长。该区域的耕地面积约占全国耕地总面积的12%,但粮食产量却占全国的约六分之一,显示出该地区农业生产的高效性。因此,研究该区域的ET?预测具有重要的应用价值。

在数据收集和特征选择方面,本研究整合了多源数据,包括气象数据和土地数据等。为了筛选出与ET?高度相关的外部变量,研究者引入了最大信息系数(MIC)方法,这是一种能够有效衡量变量间相关性的统计工具。通过MIC计算,研究者发现某些外部变量与ET?之间存在显著的正相关关系,而另一些变量则相关性较低。基于这一分析,研究者选取了与ET?相关性较高的变量作为预测模型的输入特征,同时对部分相关性中等的变量也进行了保留,以确保模型的全面性。

在模型构建方面,EA-ensemble方法将外部注意力机制与多种子模型相结合,通过动态调整各子模型的权重,实现更优的预测效果。这一方法的优势在于,它不仅能够提高多步预测的准确性,还能够增强模型的可解释性。为了验证这一方法的有效性,研究者采用了SHAP(SHapley Additive exPlanations)技术,对模型的预测结果和外部变量之间的关系进行了深入分析。SHAP技术能够帮助研究者理解不同变量对预测结果的贡献程度,以及不同子模型在预测过程中的作用。研究结果表明,外部变量中,净太阳辐射、最高温度和相对湿度对ET?的影响最为显著。

在实验结果方面,研究者对EA-ensemble方法与传统单一模型的预测效果进行了比较。结果表明,在预测时间范围从PH1到PH28的情况下,EA-ensemble方法的NSE(纳什效率系数)范围从0.99到0.60,显著优于所有单一模型。同时,EA-ensemble方法在MAPE(平均绝对百分比误差)指标上也表现出明显的优势,比平均方法和加权平均方法分别提高了约50%和25%(p值<0.05)。这些结果表明,EA-ensemble方法在多步预测任务中具有更高的准确性和稳定性。

此外,研究者还对EA-ensemble方法进行了消融实验,以验证其各个组成部分的作用。在第一组实验中,研究者比较了不同集成学习方法对预测结果的影响,包括简单平均方法、使用MLP进行加权输出的方法,以及本研究提出的EA-ensemble方法。实验结果表明,EA-ensemble方法在预测性能上优于其他方法。在第二组实验中,研究者进一步分析了各子模型对预测结果的贡献,发现不同子模型在不同时间尺度下的表现存在差异,而EA-ensemble方法能够有效整合这些差异,实现更优的预测效果。

本研究的创新点在于,提出了一种新的集成学习方法,该方法结合了外部注意力机制和多种子模型,从而避免对单一模型的过度依赖。同时,研究者通过MIC方法实现了多源信息的融合,提高了模型的输入特征选择效率。此外,研究者还通过SHAP技术分析了模型的可解释性,为理解ET?的预测机制提供了新的视角。研究结果表明,EA-ensemble方法不仅能够提高ET?的预测精度,还能够增强模型的可解释性,为未来的农业水资源管理提供更加科学的决策支持。

本研究的贡献主要体现在以下几个方面:首先,提出了一种基于外部注意力机制的集成学习方法,有效整合了不同子模型的预测结果,提高了多步预测的准确性;其次,通过MIC方法实现了多源信息的融合,提高了模型的输入特征选择效率;第三,研究者在不同时间尺度下对模型进行了测试,验证了EA-ensemble方法的适用性;第四,通过SHAP技术分析了模型的可解释性,为理解不同变量对预测结果的影响提供了新的方法。这些贡献不仅拓展了ET?预测的研究方法,也为农业水资源管理提供了新的思路。

本研究的实施过程包括数据收集、特征选择、模型构建和结果验证等多个环节。首先,研究者收集了淮河流域五个站点的多源数据,包括气象数据和土地数据等。其次,通过MIC方法筛选出与ET?高度相关的外部变量,确保模型的输入特征具有代表性。然后,研究者构建了EA-ensemble方法,将外部注意力机制与多种子模型相结合,通过动态调整各子模型的权重,实现更优的预测效果。最后,研究者对模型的预测结果进行了验证,包括对不同时间尺度下的预测性能进行评估,并通过SHAP技术分析了模型的可解释性。

在模型构建过程中,EA-ensemble方法的优势在于其能够有效整合不同子模型的预测结果,提高整体预测性能。外部注意力机制的应用使得模型能够根据多源数据之间的相互作用,动态调整各子模型的权重,从而实现更精准的预测。这种方法不仅提高了预测的准确性,还增强了模型的可解释性,使得研究者能够更好地理解不同变量对预测结果的影响。此外,EA-ensemble方法在不同时间尺度下的表现也得到了验证,显示出其在多步预测任务中的广泛适用性。

在实验验证过程中,研究者对EA-ensemble方法的预测效果进行了全面评估。通过比较不同模型的预测结果,研究者发现EA-ensemble方法在多步预测任务中表现优于传统单一模型。同时,通过SHAP技术对模型的可解释性进行了分析,研究者能够识别出不同变量对预测结果的贡献程度,并进一步理解不同子模型在预测过程中的作用。这些分析结果不仅为模型优化提供了依据,也为未来的农业水资源管理提供了更加科学的决策支持。

本研究的实施还得到了相关科研基金的支持。研究工作得到了国家自然科学基金的资助(项目编号11701363),同时也得到了水利部重点实验室开放基金的支持(项目编号IWHR-SEDI-2023-10)。这些支持使得研究者能够获得更多的数据资源和研究条件,为实验的顺利进行提供了保障。

总体而言,本研究通过引入外部注意力机制和多种子模型,构建了一种新的集成学习方法(EA-ensemble),用于ET?的多步预测。该方法在淮河流域五个站点的实验中表现出较高的预测精度和稳定性,同时通过MIC方法实现了多源信息的融合,提高了模型的输入特征选择效率。此外,通过SHAP技术对模型的可解释性进行了分析,为理解不同变量对预测结果的影响提供了新的视角。这些成果不仅拓展了ET?预测的研究方法,也为农业水资源管理提供了更加科学的决策支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号