多约束物理信息驱动的生成对抗网络(PIGAN)实现了基于少量数据的城市风场预测

《BUILDING AND ENVIRONMENT》:Multi-Constraint Physics-Informed Generative Adversarial Networks (PIGAN) Enable Small-Data Learning for Urban Wind Field Prediction

【字体: 时间:2026年01月06日 来源:BUILDING AND ENVIRONMENT 7.6

编辑推荐:

  物理信息生成对抗网络(PIGAN)通过四分量物理约束损失(连续性、动量守恒、湍动能及雷诺应力)和分阶段训练策略,在数据稀缺条件下实现城市风场高精度预测与不确定性量化,在多国实测数据集上验证其泛化能力,为风险敏感型城市规划提供实时决策支持。

  
吴一涵|曹子涵|雷宇斌|韩雨轩|袁曼|王丽辉|周行刚
华中科技大学建筑与城市规划学院,武汉,430074,中国

摘要

城市风场预测对于空气质量评估、行人舒适度评价和可持续城市设计至关重要。传统的计算流体动力学方法计算成本高昂,而传统的深度学习方法则需要大量样本的数据集。我们提出了一种基于物理信息的生成对抗网络(PIGAN)框架,仅使用大约200个训练样本即可实现实际预测。该模型以建筑高度数据作为输入,同时预测水平速度分量(u, v)、湍流动能(κ)和雷诺应力(τ)。通过分阶段训练,定制的四组分物理信息损失函数强制满足连续性、x-动量、y-动量和涡粘性约束,逐步引入重建、对抗性和物理目标。这防止了收敛性能的下降,使得L1损失仅为2.385,而同时优化所有损失函数时的L1损失为4.116。消融研究表明,多约束集成可将预测变量的均方根误差(RMSE)降低11-36%,物理损失函数具有强大的正则化能力。在来自不同国家的真实城市测试集上,该框架的预测准确度分别为:u的R2为0.60,κ的R2为0.42。将其转移到理想化几何形状上的实验表明性能显著提升(u的R2为0.92,v的R2为0.80),验证了该框架能够学习通用流动物理规律。通过蒙特卡洛dropout和方差缩放校准,预测区间覆盖概率(PICP)达到92.3-92.7%。空间不确定性分析显示,在开阔区域性能可靠,但在建筑物尾流和街道峡谷交叉口等二维稳态假设失效的地方不确定性增加。我们的研究为数据稀缺的环境建模中基于物理约束的机器学习建立了一个框架,使得实时、风险敏感的城市规划和设计成为可能。

引言

全球城市化进程的前所未有的速度从根本上改变了人口密集地区的大气边界层动态,产生了复杂的风场模式,这些模式深刻影响了城市空气质量、热舒适度、污染物扩散、能源消耗模式以及低空飞行器的飞行安全[[1], [2], [3], [4], [5], [6], [7], [8], [71]]。随着城市在垂直和水平方向的扩张,准确预测城市风环境已成为公共卫生保护、气候适应性和基于证据的城市设计的核心[[9], [10], [11], [12]]。大气流动与异质城市形态之间的相互作用产生了强烈的非均匀风场模式,包括街道峡谷效应、建筑物诱导的尾流和局部加速区,这些因素共同决定了通风效率和行人舒适度[[13], [14], [15]]。
传统上,高保真度的城市风场预测依赖于计算流体动力学(CFD),特别是雷诺平均纳维-斯托克斯(RANS)和大涡模拟(LES),这些方法通过在离散的城市域上数值求解流体运动控制方程来实现[[16], [17], [18], [19]]。尽管这些方法提供了物理上严谨的解决方案,但其计算成本随空间分辨率和域大小的增加而急剧上升,即使在高性能集群上,对于城市案例也需要数天到数周的计算时间。这一成本障碍严重限制了其在迭代城市设计和规划中的应用,而在这种场景中快速评估多个方案是至关重要的。此外,配置湍流模型、边界条件和网格策略所需的专业知识也限制了非专业从业者使用基于CFD的评估方法。
深度学习的兴起为通过从CFD生成的数据集中学习统计映射来加速流动预测提供了新的机会[[20], [21], [22]]。然而,大多数纯数据驱动的模型作为黑箱运行,在应用于城市风场预测时面临关键限制[[23]]。特别是,它们依赖于庞大的训练数据集,当每个样本都需要昂贵的CFD模拟时,这种方法变得不切实际[[24]]。此外,缺乏明确的物理约束导致守恒定律被违反,非物理流动模式的出现[[20,25,26]]。没有不确定性估计的确定性预测进一步限制了它们在风险敏感的城市规划中的实用性[[27]]。
最近关于基于神经网络的城市风场预测的研究显示,数据密集型学习策略和基于物理信息的方法之间存在明显的分歧。传统的数据驱动模型通常需要数千到数十万个样本。例如,黄等人[[28]]通过几何增强将2,665个城市配置扩展到9,290个样本,而邵等人[[29]]使用了超过250,000个样本。虽然大样本量有助于实现合理的准确度,但对大型CFD数据集的依赖从根本上限制了其可扩展性。另一方面,基于物理信息的神经网络(PINNs)表现出明显更高的数据效率。魏和Ooka[[30]]证明,用不到100个样本训练的PINN比在更多数据上训练的传统神经网络表现更好,这突显了将物理约束直接嵌入学习过程中的强大正则化效果。
除了数据可用性外,预测性能还高度依赖于建筑设计。Clarke等人[[31]]表明,MLP-Mixer架构通过第一层实现全局感受野,达到了先进的准确度(MSE 7.6 × 10??,SSIM 0.991,PSNR 42.35 dB),这对于捕捉城市流动中的长距离尾流相互作用特别有效(表1)。生成对抗网络(GAN)基模型的比较研究进一步揭示了显著的不一致性。基于pix2pix的框架实现了0.70–0.86的R2值,并且相对于CFD加速了120–240倍[[28]],而CycleGAN的性能在需要严格空间对应关系时,感知指标有所提高[[32]],但在某些情况下却下降了超过100%[[33]]。这些发现表明,仅靠建筑设计或对抗学习并不能保证物理上可靠的预测。
最近的基于物理信息的GAN框架试图在准确性和物理一致性之间取得平衡。胡等人[[34]]开发了一种条件Wasserstein GAN,通过结合对抗学习和基于物理的约束,实现了8.2 × 10?3的RMSE。王等人[[21]]通过将流场分解为空间和频率分量进一步提高了准确度(表1)。可扩展架构的并行发展促进了城市规模的推理。刘等人[[37]]引入了一种子图多尺度GNN,将GPU内存消耗降低了70%,同时在包含多达300,000个节点的域上实现了0.86–0.89的R2值。注意力机制同样通过将计算集中在高梯度区域来提高效率,相对于LES实现了数量级的速度提升[[36]]。
另一方面,基于物理信息的方法通过将物理约束直接嵌入学习过程,代表了概念上的转变,生成了结合了神经网络灵活性和物理定律严格性的混合模型[[25,26,63]]。最近的进展表明,在稀疏数据条件下具有强大的学习潜力,适用于各种流体动力学应用。Jagtap等人[[65]]引入了保守的PINNs,即使在不到100个训练样本的情况下也能保持物理守恒定律,而Kharazmi等人[[64]]提出了一种变分物理信息框架,改善了优化条件,并在观测数据有限的情况下实现了稳定收敛。在建筑规模的环境中,El Hassan等人[[76]]应用了单方程物理约束进行室内气流重建,Chen等人[[77]]表明,在Navier–Stokes方程的相关变体之间进行迁移学习可以将预测准确度提高多达97.3%。
城市风场预测的性能提升还受到训练策略和损失设计的强烈影响。最近的研究探索了多目标优化、对抗-物理损失耦合和迁移学习,以提高收敛稳定性和泛化能力(表2)。例如,基于NSGA-II的优化同时改进了多个风舒适度目标[[32]],而迁移学习在将模型从简化几何形状适应到复杂几何形状时将训练时间减少了多达50%[[38]]。尽管取得了这些进展,现有的基于PINN的城市风场预测方法在三个方面仍存在局限。首先,大多数方法依赖于单一方程约束,通常是连续性方程,这对于复杂的湍流城市流动来说正则化不足。其次,验证通常仅限于理想化几何形状,而不是具有不规则布局和高度变化的真实城市形态。第三,不确定性量化基本上缺失,使得决策者在安全关键应用中缺乏置信界限。
受到这些限制的启发,我们提出了一种基于物理信息的生成对抗网络(PIGAN)框架,将全面的物理约束与不确定性感知学习相结合。我们的贡献有三个方面:(1)一个四组分物理信息损失函数,共同强制满足连续性、动量守恒和湍流闭合关系,从而能够从有限的数据中实现准确的学习;(2)一种分阶段训练策略,逐步引入重建、对抗性和物理信息目标以提高稳定性;(3)通过蒙特卡洛dropout进行贝叶斯不确定性量化,为城市风场预测提供置信区间。通过在比传统方法小一个数量级的数据集上实现可靠预测,这项工作为数据稀缺的城市环境建模中的基于物理约束的、不确定性感知的学习建立了一个实用框架。

PIGAN架构的整体框架

我们的基于物理信息的城市风场预测系统结合了生成对抗网络(以下简称PIGAN模型)和基本的流体动力学约束,使用最少的训练数据实现了先进的性能。该框架采用了从Pix2Pix[[39]]改进的条件GAN架构,并增加了三项关键创新:通过定制的四约束损失函数实现全面的物理信息正则化,以及多通道预测

城市街区的LES模拟数据

Nazarian等人[[45]]开发的UrbanTALES数据库是一项重大的计算工作,需要超过300万CPU小时和35 TB的存储空间。该数据库使用并行的大涡模拟模型(PALM)实现了最先进的LES。研究团队创建了总共538个模拟案例,涵盖了理想化和真实的城市配置。其中,314个案例来自22个国家的真实城市社区

PIGAN训练配置和数据集特征

在这项研究中,PIGAN模型使用8个样本的批量大小进行训练,以平衡计算效率和梯度稳定性。采用了Adam优化器,初始学习率为0.001,并结合了一个线性学习率调度器,在整个训练过程中逐渐降低学习率。模型训练了200个周期以确保充分收敛。为了防止过拟合并提高泛化能力,应用了0.5的丢弃率

在数据稀缺情况下多约束物理整合的力量

我们的消融研究表明,通过PIGAN框架结合全面的物理约束可以在小样本集下实现卓越的性能,其效果相当于通常需要10-50倍大样本集的情况。分阶段训练策略将u的RMSE降低了11.0%,v降低了3.3%,κ降低了15.8%,最显著的是τ降低了35.6%,与基线模型相比

结论

我们的研究解决了阻碍基于AI的城市风场预测实际应用的三个关键障碍:过高的数据需求、不完整的物理整合和缺乏可靠的不确定性量化。通过开发一个定制的四组分物理信息损失函数,该函数通过分阶段训练同时强制满足连续性、动量守恒和湍流闭合关系,我们证明了神经网络可以实现实际的准确度

未引用的参考文献

[35]

CRediT作者贡献声明

吴一涵:撰写——原始草案、方法论、调查、资金获取、正式分析、概念化。曹子涵:撰写——原始草案、方法论、数据管理。雷宇斌:软件、资源、项目管理、方法论、调查、正式分析。韩雨轩:撰写——原始草案、可视化、调查、数据管理。袁曼:方法论、资金获取、正式分析、概念化。王丽辉:验证、正式分析、数据
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号