《International Journal of Forecasting》:Expectile-based probabilistic forecasting for spatio-temporal river network data
编辑推荐:
本文针对河流网络水质数据时空依赖性强、分布非对称的特点,提出一种结合期望回归与函数型数据分析的时空概率预测方法。研究通过构建可加模型刻画水质指标(如总氮)的时空动态,并利用函数型自回归模型实现多步概率预测。该方法在韩国美湖河数据集上验证了其优越的预测性能,为水质风险评估提供了新工具。
随着工业化和城市化进程加速,河流水质监测成为环境管理的重要任务。传统水质预测方法多聚焦于均值趋势,难以捕捉极端污染事件的风险。韩国美湖河流域作为典型工业密集区域,其水质数据呈现复杂的时空异质性和非对称分布特征,亟需能够量化不确定性的概率预测方法。
为应对这一挑战,研究团队在《International Journal of Forecasting》发表论文,提出了一种基于期望回归的河流网络时空概率预测框架。该方法通过结合非参数可加模型与函数型时间序列分析,实现了对水质指标(如总氮浓度)的全分布预测。研究利用2008-2022年美湖河21个监测点的日尺度数据,构建了包含空间、季节、长期趋势及其交互效应的期望回归模型,并采用惩罚样条技术控制平滑度。通过函数型主成分分析提取年际动态特征后,借助向量自回归模型对未来水质曲线进行概率预测。
关键技术方法包括:
- 1.
期望回归模型拟合不同分位水平的水质响应曲线;
- 2.
基于B样条的时空可加模型结构,包含空间、季节、趋势及交互项;
- 3.
河流网络特异的空间惩罚项设计,考虑汇流点水文联系;
- 4.
函数型主成分分析结合VAR模型的多步预测策略。
时空组件解析
模型估计结果显示,工业区密集河段(如忠州Technopolis周边)空间组分显著偏高,季节性组分揭示夏季总氮浓度普遍低于冬季。值得注意的是,高期望水平(如τ=0.9)的季节波动小于低期望水平,表明夏季水质分布更具右偏特征。趋势组分检测到2016-2017年间的浓度回升,可能与同期工业生产活动增强相关。
交互效应验证
通过比较包含交互项的模型与简化模型,发现空间-季节交互项对河段54等位置的拟合效果提升显著。例如,该河段夏季高期望水平(τ=0.9)的预测曲线更贴近观测值,验证了时空耦合效应对极端水质事件的捕捉能力。
预测性能评估
采用连续分级概率评分评估预测效果,本文方法在2013-2024年样本上的平均CRPS为0.0419,显著优于三类基准方法(如全局分位数法的0.0584)。两年期预测中性能进一步优化(CRPS=0.0366),证明模型具备良好的时序外推能力。2025年概率预测结果显示,1月与7月95%预测区间宽度差异达0.8 log-TN单位,精准反映了水质季节性风险波动。
结论与展望
本研究发展的期望回归框架为河流网络水质管理提供了概率预测新范式。通过解析时空异质性并量化不确定性,方法可支持洪水期污染预警、工业排放许可制定等决策场景。未来工作将拓展至多变量水质指标联合预测,并探索极端值理论在尾部分布建模中的应用。