一种在GPU加速计算平台上用于鱼类游泳模拟的快速并行浸没边界方法

《Ocean Engineering》:A fast parallel immersed boundary method for fish swimming simulation on GPU-accelerated computing platform

【字体: 时间:2025年11月05日 来源:Ocean Engineering 5.5

编辑推荐:

  GPU加速多直接力浸没边界法水体运动仿真研究

  在海洋工程领域,准确且高效地模拟涉及多个运动物体的流体-结构相互作用(FSI)问题仍然是一项具有挑战性的任务,尤其是在高分辨率三维计算中。随着计算需求的增加,传统的单机计算方法逐渐难以满足大规模模拟的需求,因此,利用图形处理单元(GPU)进行高性能计算成为一种可行的技术路径。本文提出了一种基于多直接作用力浸入边界法(MDF-IBM)的GPU加速数值框架,旨在解决多物体流体-结构耦合问题中的计算瓶颈,提高模拟效率和精度。

在自然界和工程系统中,流体与多个运动物体的耦合现象非常普遍。例如,在生物流体中,多个细胞随血液流动;在颗粒流中,大量固体颗粒与流体耦合运动;在河流中,鱼群以群体形式游动。这些“多物体-流体”耦合问题通常具有复杂的边界、不稳定的运动、强物体间相互作用等特征,且其数值模拟所需的计算资源远高于单一物体问题。传统的计算流体力学(CFD)方法在处理此类问题时面临诸多挑战,如网格重生成、边界条件的精确施加以及计算效率的限制。而GPU的并行计算能力为解决这些问题提供了新的思路,其数千个计算核心能够高效处理高度并行的网格计算任务,从而显著提升计算速度。

浸入边界法(IBM)由Peskin于1972年首次提出,已成为模拟复杂运动边界流体问题的常用工具。该方法通过在固定欧拉网格上求解流体,同时用拉格朗日标记表示浸入物体,借助插值和分布函数实现流体与结构的相互作用。IBM方法通常分为扩散界面法和尖锐界面法两种类型。扩散界面法通过平滑的强制项和离散的δ函数来施加边界条件,虽然在处理复杂、运动边界时具有较高的鲁棒性,但其在界面附近可能引入局部模糊效应。相比之下,尖锐界面法更注重几何边界的确切表示,通常通过引入辅助单元(如ghost-cell方法)或重新定义控制体积和通量(如cut-cell方法)来实现。这类方法在捕捉边界层和减少数值扩散方面表现出色,但对三维几何或运动变形物体的处理需要更复杂的几何建模和插值策略。

本文采用扩散界面IBM方法,因其在鱼游模拟中能够平衡计算效率与边界条件施加的准确性。在IBM框架中,强制方案的选择对于准确且高效地施加无滑移边界条件至关重要。直接强制IBM(DF-IBM)因其概念简单、易于实现而被广泛采用,它通过消除基于ghost-cell的IBM中复杂的插值过程,提高了计算效率。在此基础上,Wang等人(2008)提出了多直接强制IBM(MDF-IBM),通过在每个时间步中迭代施加强制项,直至满足预设的收敛标准,从而显著减少穿透误差,同时保留直接强制方法的鲁棒性和效率。近年来,Soydan等人(2025)进一步改进了DF-IBM,用于模拟波浪中浮体的运动,表明直接强制策略在复杂流体-结构相互作用问题中依然具有重要价值。

在本研究中,MDF-IBM被用于模拟鱼游过程,其核心优势在于能够精确施加无滑移边界条件,同时支持高效的并行计算。为了实现这一目标,本文采用了一组拉格朗日标记来表示鱼体与流体的界面,这些标记沿鱼体的三角形表面网格分布,并随鱼体的变形或运动同步移动。这种表示方式使得无滑移边界条件的直接施加成为可能,并且可以通过表面积分直接计算流体动力。另一种常见的方法是使用水平集函数来描述物体边界,例如Soydan等人(2025)采用的射线投射法。该方法通过将界面定义为有符号距离函数的零等值线,从而避免了显式的拉格朗日追踪,尤其适用于处理拓扑变化或与单流体两相模型的耦合。然而,水平集方法可能需要额外的重新初始化步骤,并且在缺乏特殊数值处理的情况下可能导致界面模糊。相比之下,本文采用的拉格朗日标记方法能够直接控制边界分辨率,特别适合处理高度变形的几何结构和精确的力计算问题,如鱼游模拟。

随着模拟物体数量的增加和边界精度的提高,拉格朗日标记的数量迅速增长,导致系统中欧拉-拉格朗日耦合的计算复杂度显著上升。边界力的插值与传播过程需要频繁的局部邻域搜索和数据更新,这对计算效率和内存管理提出了更高要求。在串行框架中,尤其是在三维计算域内,大量边界数据和插值操作容易成为计算瓶颈,严重限制了大规模多物体流体问题的求解能力。因此,开发一种适用于多物体和多尺度问题的高性能IBM求解器,成为当前研究的重要方向。近年来,一些研究者已经探索了GPU在IBM中的应用,例如Ames等人(2020)开发了一种基于多GPU分布式并行计算的细胞级三维血液流动模拟方法,重点优化了FSI问题中的性能瓶颈;Kuo等人(2020)提出了用于模拟高速可压缩气体流动的IBM方法,在多GPU系统中实现了89倍的加速,且并行效率高达92%;Hua等人(2023)则在国产GPU类加速器DCU上开发了并行IBM方法,用于两相流模拟,并通过MPI+HIP编程模型和粗网格聚合(CGA)技术提升了性能。这些研究证明了GPU加速在IBM中的有效性,但它们主要针对特定应用场景,如细胞级血液流动、单体可压缩气体流动或两相问题,未能直接解决大规模多体流体-结构相互作用问题,也未引入多直接作用力策略以提高边界条件施加的准确性。此外,一些实现依赖于特定硬件平台(如DCU),限制了其可移植性。为克服这些局限,本文提出了一种GPU加速的MDF-IBM框架,集成了优化的多网格求解器、基于δ函数的warp级插值以及高效的多GPU通信策略。

本文开发的GPU加速IBM算法能够高效处理多物体流体-结构耦合问题。在该框架中,非均匀Navier-Stokes方程通过投影法分步求解,其中对流项采用高阶WENO23方案进行离散,扩散项则使用二阶中心差分方案。为了确保无滑移边界条件的准确施加,浸入边界被表示为一组拉格朗日标记,并通过迭代强制策略与流体域进行耦合。该策略在每个时间步中反复调整边界力,直到满足收敛标准,从而有效减少穿透误差,同时保持计算的稳定性。此外,本文引入了多种GPU优化技术,包括内存分块(memory tiling)、访问顺序优化(access reordering)、warp级增量插值(warp-level incremental interpolation)以及异步CUDA流(asynchronous CUDA streams),以进一步提升计算效率。通过这些优化,框架能够在单个GPU上实现显著的性能提升,同时支持多GPU并行计算,采用基于NVIDIA集体通信库(NCCL)的通信机制和动态负载均衡策略,以确保多个加速器在单个计算节点内的高效协作。

为了验证所提出方法的准确性和鲁棒性,本文进行了三维球体绕流的基准模拟实验。实验中,将一个静止的三维球体放置在流场中,计算不同雷诺数下的阻力系数,并将其与现有文献中的结果进行对比。雷诺数作为无量纲参数,用于描述流体流动的特性,其定义为 $ Re = \frac{U_\infty D}{\nu} $,其中 $ U_\infty $ 是入口速度,$ D $ 是物体直径,$ \nu $ 是流体的动力粘度。通过使用GPU加速的IBM方法,实验结果在精度上与经典数值方法一致,同时显著提升了计算效率。此外,本文还进行了自主游动的仿生鳗鱼的模拟,以展示该方法在处理多个运动物体时的适用性。仿生鳗鱼的运动轨迹和流体动力响应被准确捕捉,进一步验证了MDF-IBM在多物体流体-结构耦合问题中的有效性。

在性能评估方面,本文在GPU集群上对多网格算法、流体-结构耦合算法以及多GPU实现进行了测试。实验环境配置为一台搭载双插槽64核Intel Xeon Gold 6530 CPU(128线程,基础频率800 MHz,最大涡轮频率4.0 GHz,X86_64架构)的服务器,并配备四块NVIDIA L40 GPU加速卡。每块GPU提供高达48 GB的显存,并具备强大的并行计算能力。通过对比CPU基准(32核)和GPU加速结果,本文在四块GPU配置下实现了高达46.2倍的加速效果,显著提升了计算效率。这一结果表明,所提出的GPU加速框架不仅在单GPU上表现出色,而且在多GPU并行计算中也具有良好的扩展性。此外,该框架通过优化内存管理和并行通信策略,有效减少了计算瓶颈,使得大规模、高保真度的FSI模拟成为可能,同时降低了计算资源的消耗。

本文的研究成果为复杂海洋FSI问题提供了新的解决方案。通过将MDF-IBM与GPU加速技术相结合,本文开发了一种适用于多物体、多尺度问题的高性能数值框架。该框架在保持计算精度的同时,显著提升了计算效率,使得大规模模拟成为可能。此外,该方法在处理复杂边界和多体相互作用时表现出良好的鲁棒性,适用于多种工程和生物流体问题。例如,在生物流体中,该方法能够准确模拟鱼群的游动行为;在海洋工程中,可用于研究船舶、海洋平台等多物体在流体中的运动特性。未来的研究可以进一步拓展该框架的应用范围,例如将其应用于多相流、拓扑变化等更复杂的流体-结构耦合问题,同时探索更高效的并行计算策略,以应对日益增长的计算需求。

总之,本文提出了一种基于MDF-IBM的GPU加速数值框架,用于解决多物体流体-结构相互作用问题。该框架通过高阶插值方法、优化的多网格求解器和高效的多GPU通信策略,显著提升了计算效率和精度。实验结果表明,该方法在三维球体绕流和自主游动的仿生鳗鱼模拟中均表现出良好的性能,验证了其在复杂海洋工程问题中的应用潜力。随着计算资源的不断演进和并行计算技术的进一步发展,该框架有望成为处理大规模、高保真度FSI问题的重要工具。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号