基于混合云与生成对抗网络的深度学习框架在环境时间序列预测中的应用研究
《IEEE Access》:Hybrid Cloud-Integrated and GAN-Based Deep Learning Framework for Prediction of Environmental Time Series
【字体:
大
中
小
】
时间:2025年12月16日
来源:IEEE Access 3.6
编辑推荐:
本文推荐一项结合混合云架构与生成对抗网络(GAN)的环境时间序列预测研究。针对气象数据在传输中易缺失、传统预测模型难以捕捉复杂时空依赖等问题,作者提出一种集成ThingSpeak云平台、Vanilla GAN数据填补与多种单变量统计模型(ARIMA、SARIMA、SES、DES、TES)的预测框架。实验表明,SARIMA模型在多数气象参数上表现最优,GAN填补后其nMAE和nMSE显著降低,为城市气象监测与灾害预警提供了可扩展、高精度的解决方案。
随着全球气候变化加剧,极端天气事件频发,准确预测气象参数已成为城市管理、农业规划和灾害预警的关键。然而,气象数据在采集和传输过程中常因网络中断或设备故障出现缺失,传统预测模型往往难以有效处理非平稳、具季节性的时间序列,且多云环境下的实时数据处理对计算资源提出更高要求。为此,研究人员在《IEEE Access》上发表了一项研究,提出了一套融合云服务、生成对抗网络和经典时间序列模型的集成框架,旨在提升气象数据质量与预测精度。
本研究主要依托ThingSpeak云平台实现印度斋浦尔和坎普尔两市六项气象参数(温度TP、降水量PR、云量CC、风速WS、风向WD、露点DP)的实时传输与存储;采用Vanilla GAN对缺失数据进行生成填补,通过生成器与判别器的对抗训练提升数据完整性;并系统比较了ARIMA、SARIMA、简单指数平滑(SES)、双指数平滑(DES)和三重指数平滑(TES)等单变量模型在填补前后的预测效果。评价指标选用归一化平均绝对误差(nMAE)和归一化均方误差(nMSE),同时通过Friedman检验、Nemenyi事后检验和Wilcoxon符号秩检验对模型性能进行统计验证。
研究使用Kaggle上公开的2009–2020年每小时气象数据,经周平均重采样后构建时间序列。通过ThingSpeak云平台传输数据至基站,评估显示斋浦尔和坎普尔的传输延迟与吞吐量处于可接受范围,表明云服务能支持实时、多节点的环境监测需求。
Vanilla GAN在生成器与判别器损失稳定后(约200轮训练),有效重构了缺失气象值。结构相似性指数(SSIM)多数接近1.00,表明生成数据与原始数据高度一致。针对缺失率较高的PR和CC参数,GAN填补在部分变量上较均值填补进一步降低了nMAE。
SARIMA模型在多数参数上表现最佳,尤其在TP、DP、CC和WD的预测中显著优于其他模型。以坎普尔CC为例,SARIMA的nMAE从填补前的0.16降至0.10;斋浦尔CC的nMAE从0.14降至0.08。而TES模型由于过度拟合季节性波动,预测误差较大。
Friedman检验证实各模型性能存在显著差异(p < 0.05)。Nemenyi事后检验指出SARIMA与TES差异显著。Wilcoxon检验进一步表明,仅SARIMA在GAN填补后取得统计显著的提升(p = 0.0313)。时间序列交叉验证结果也显示SARIMA的nMAE最稳定且最低。
本研究验证了云平台+GAN+经典时间序列模型这一技术路线的可行性。SARIMA因能同时捕捉趋势与季节性,在气象预测中保持优势;而GAN填补虽提升数据质量,但对高度波动参数(如PR)的改善有限。研究为中小城市气象监测提供了低计算成本、易实施的解决方案,对水资源管理、农业灾害预防具有实践意义。未来可扩展至多变量模型、引入更复杂的GAN变体,并探索边缘计算以降低云传输延迟。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号