HWGEN:一种每小时生成随机风速数据的工具
《International Soil and Water Conservation Research》:HWGEN: An Hourly Wind Stochastic GENerator
【字体:
大
中
小
】
时间:2025年10月23日
来源:International Soil and Water Conservation Research 7.3
编辑推荐:
本研究提出HWGEN模型,分带方向和不带方向两种版本,基于中国西北388个气象站2000-2020年小时风速数据,优化了日风速概率分布(Weibull/Gumbel)和日最大风速比值(Hratio)的Lognormal分布拟合,显著提升了极端风速(≥5/8 m/s)模拟精度,降低风蚀力与风功率密度误差至8.1%/36.5%,并验证了时空异质性建模的有效性,为风能评估和风蚀预测提供新工具。
风速是气候研究中的一个关键变量,它不仅反映了大气动力学特征,还在多种地表过程的定量评估中扮演着重要角色,包括资源评估、灾害预测以及风能利用等。由于风速在时间和空间上的高度异质性,观测数据和模型在捕捉极端风速事件时往往存在较大误差。为了解决这一问题,研究团队开发了一种名为“每小时风速随机生成器”(Hourly Wind stochastic GENerator, HWGEN)的单站随机模型,该模型能够更准确地模拟每日和每小时风速,特别是极端风速事件。HWGEN包括两个版本:HWGEN_D,该版本同时模拟风速和风向;HWGEN_ND,该版本仅模拟风速,适用于数据稀疏的区域。通过使用中国西北地区388个气象站(2000–2020年)的每小时数据,HWGEN_D在每日风速模拟中采用自适应的韦布尔和古姆贝尔分布,同时使用对数正态模型来模拟每日最大每小时风速(Umax)。相比WINDGEN,HWGEN_D将风蚀力和风能密度的平均绝对百分比误差分别从72.8%降低至36.5%,从35.1%降低至8.1%。HWGEN_ND在性能上稍逊一筹,但所需的参数仅占15%。此外,HWGEN成功再现了观测到的每日最大10分钟风速(Dmax)与Umax之间的关系,这是现有模型所缺乏的。HWGEN能够随机生成无限长的每小时风速序列,从而更好地表示极端风速事件,并提高风蚀和风能风险评估的准确性。
风速的模拟通常分为两种类型:动态模拟和统计模拟。动态模拟包括中尺度模型,如天气研究和预报模型(WRF),这些模型在公里尺度上运行;而微尺度模型如大涡模拟(LES)、计算流体动力学(CFD)和加州气象模型(CALMET)则在小于公里的尺度上进行。然而,由于风速受到多种因素的影响,包括气压系统、温度梯度和地形特征,这些因素之间的复杂相互作用往往无法被动态模型完全捕捉,因为模型忽略了或近似了亚网格尺度过程。此外,动态风速模型通常需要大量的计算资源。
相比之下,统计模型更容易构建,计算复杂度较低,且在不同气候区域中表现出较强的适应性。天气生成器(Weather Generators, WGs)是用于生成无限长气候变量时间序列的随机统计模型。这些生成序列的统计特征与特定站点或区域的观测数据高度相似,同时保留了天气变化的内在随机性。此外,通过区域化随机模型的参数,可以在没有观测站点的地区生成长期的气候模拟数据。因此,随机风速模型在地表过程的风险评估中被广泛应用,如风蚀评估、风能资源评价和森林火灾风险评估。
在风速模拟中,统计模型通常在日和小时尺度上进行,有时甚至达到分钟或秒级的分辨率。常用的概率分布函数(PDF)用于模拟和预测每日平均风速的分布,选择合适的PDF对于实现准确的模拟至关重要。在特定风向中,韦布尔分布是模拟每日风速的最常用模型。此外,许多研究评估了不同地理区域中各种PDF在拟合风速数据方面的性能,包括古姆贝尔、广义伽玛、伯尔、帕雷托-伯尔-费勒分布等。这些研究指出,PDF在风速建模中的适用性因地区而异,单一分布可能不适合所有地区或季节。因此,提高每日风速随机模型的准确性依赖于选择能够有效捕捉特定区域和季节风速特征的PDF。
高时间分辨率的风速数据对于风相关的应用至关重要。例如,依赖于每日平均风速来估计作物生长或风能资源可能会导致显著的偏差。一些研究已经探讨了风速数据分辨率对风蚀预测的影响,结果表明,更高的风速数据分辨率显著提高了风蚀风险评估的准确性。为了获得每小时风速数据,一些研究使用线性插值将每天记录四次或八次的观测数据插值到每小时间隔。然而,由于风速并非线性变化,这种方法可能会引入较大的误差。研究团队还比较了使用线性插值和实际每小时风速数据在风蚀预测中的效果,结果显示,线性插值低估了每小时风速超过5 m s-1的频率,以及风蚀力。
风速模拟方法通常包括动态模拟和统计模拟。动态模拟依赖于复杂的计算过程,而统计模拟则更易于实施且计算复杂度较低。因此,近年来,支持向量机(SVM)、人工神经网络(ANN)、模糊逻辑(FL)以及机器学习和人工智能方法受到了越来越多的关注,因为它们在提高模拟精度方面表现出优势。然而,这些方法在减少计算复杂度和准确模拟极端风速方面仍然面临挑战。
为了生成每小时风速,研究团队采用了一种基于日变化特征的模拟方法。尽管在某些站点,日变化可能不是风速的重要因素,但在研究区域的大多数站点中,余弦函数有效地拟合了日变化特征。因此,研究团队通过应用余弦函数和一系列步骤来模拟每小时风速。首先,研究团队计算了每小时风速的最大值与每日平均风速的比值,然后使用对数正态分布拟合该比值的季节性频率分布。通过最大似然估计(MLE)方法,研究团队估计了每个季节和站点的对数正态分布参数,并生成了随机的比值序列。接着,研究团队使用这些比值来模拟每小时风速。
在评估模拟结果时,研究团队采用了多种指标,包括均方根误差(RMSE)、平均绝对百分比误差(MAPE)、纳什-苏特cliffe效率系数(NSE)、相对误差(RE)和绝对误差(AE)。这些指标用于衡量模拟值与观测值之间的差异。其中,RMSE和MAPE越小,说明模拟效果越好,而NSE越接近1,说明模型的模拟效果越佳。
研究结果表明,HWGEN在模拟每日和每小时风速方面显著优于WINDGEN。这些改进主要体现在风蚀力和风能密度的模拟上,这两者都受到准确模拟极端风速的影响。此外,HWGEN在模拟每日最大10分钟风速(Dmax)和每小时风速(Umax)之间的关系方面表现出色,成功再现了观测到的线性相关性。这些结果表明,HWGEN为风相关的应用提供了一个更可靠的工具,特别是在风蚀评估和可再生能源研究中。
在对模型性能的评估中,研究团队还比较了HWGEN_ND和HWGEN_D在模拟每日和每小时风速时的表现。结果显示,虽然HWGEN_ND在某些统计指标上略逊于HWGEN_D,但它仍然优于WINDGEN。此外,HWGEN_ND所需的参数数量仅为HWGEN_D和WINDGEN的15%,这使得它在区域化和广泛应用方面更具优势。研究团队还发现,HWGEN_ND在模拟极端风速时表现出一定的准确性,这有助于评估极端天气事件的风险。
在进一步的分析中,研究团队探讨了不同概率分布对风速模拟的影响。结果显示,HWGEN_D在模拟每日风速时采用了最优的概率分布,如韦布尔和古姆贝尔分布,从而提高了模拟精度。相比之下,WINDGEN始终使用韦布尔分布,这可能限制了其对极端风速的再现能力。此外,HWGEN_ND在模拟每日风速时采用三参数韦布尔分布,这种方法在模拟所有方向的每日风速时表现出更优的拟合效果,从而提高了模型的适用性。
研究团队还探讨了风速的长期依赖性,即风速在时间序列中表现出的自相似性和持久性。通过使用广义赫斯特-柯尔莫哥洛夫(GHK)模型,研究团队能够再现复杂的依赖结构以及非高斯分布。HWGEN_ND在模拟这些长期依赖性方面表现出色,其模拟结果与观测值之间的相关性得到了较好的保留。此外,HWGEN_ND在模拟更高阶统计量,如偏度(SKEW)和峰度(KURT)方面表现出一定的优势,这可能是由于HWGEN_ND对Hratio(Umax/Umean)的显式模拟,从而提高了最大风速的再现准确性。
尽管HWGEN在模拟风速方面表现出色,但它仍然存在一些局限性。例如,HWGEN_ND在模拟极端每日风速时存在低估的倾向,这表明三参数韦布尔分布在捕捉非方向性每日风速分布的尾部特征方面仍有改进空间。此外,HWGEN在模拟每小时风速时采用余弦函数,这在某些站点上表现不佳,尤其是那些具有复杂日变化特征的站点。未来,研究团队计划探索其他概率分布,如伯尔、古姆贝尔和广义伽玛分布,以更好地表示风速的随机特征。此外,他们还计划通过结合传统插值和深度学习技术,开发适用于HWGEN_D参数的地理模型,从而生成未监测站点的每日和每小时风速数据。通过将未来生成器参数的预测纳入专家知识或全球气候模型(GCMs),可以进一步提高在气候变化背景下每小时风速的模拟效果,为评估风相关过程的风险提供有价值的工具。
综上所述,HWGEN模型在风速模拟方面取得了显著进展,特别是在捕捉极端风速事件上。这些改进对于风蚀评估和风能研究等应用具有重要意义。未来,研究团队将继续优化模型,以更好地适应不同地区的风速特征,并进一步提高模拟精度。同时,他们也将探索更先进的方法,以应对数据稀疏区域和复杂地形带来的挑战,从而为风相关应用提供更可靠的数据支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号