首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
王宗辰  原野  李宏伟 《海洋通报》2020,39(2):200-205
地震海啸通常发生在大洋板块向陆地板块俯冲的区域,距离震源最近的国家和地区往往在震后5~20 min之内就会遭受到海啸袭击。因此,及时的海啸预警和准确的海啸预报结果对于民众和决策者都至关重要。为了提升海啸预警效率,缩短海啸预报时间,本研究对COMCOT海啸数值模型进行了基于图形计算单元GPU的二次并行开发。将原模型中海啸传播计算模块通过CUDA_C语言编写内核函数整体移植到GPU上并行加速,CPU负责模型其他代码的执行。为了减少CPU和GPU之间的数据通信,将吸收边界和变量更新函数一并改写。仅在需要输出的时间节点,GPU向CPU传递结果,其他时间步长,CPU和GPU之间只有指令和少量参数传输,基本可视为零耗时。基于GPU并行加速的COMCOT较串行版本效率提升超过67倍,加速性能显著优于基于CPU共享内存的OpenMP并行版本。交叉使用常水深和真实地形,采用均匀滑移海啸源和有限元海啸源对模型的计算结果进行了较为全面的分析检验,相对误差最大不超过1%,为大范围的越洋海啸实时计算提供了有力工具。  相似文献   

2.
基于图形处理器的海浪仿真研究   总被引:3,自引:0,他引:3  
提出了一种新的海浪数学模型构造算法,利用基本噪音函数构建Perlin噪音函数,并利用Perlin噪音函数生成的高度场为海浪中的水质点提供高度采样源。同时针对海浪仿真中计算量大的问题,以及依赖CPU完成图形运算的不足,提出用图形处理器(GPU)中的顶点着色器和像素着色器实现海浪的仿真,以平衡CPU和GPU的负载,确保仿真实时和逼真的视觉效果。  相似文献   

3.
由于在平衡计算效率和精度上具有优势,Boussinesq相位解析数学模型研究不断取得突破,已成为波浪和水流精细化模拟的较优解析方式,为海岸工程、环境、地质等问题提供了实用和高效的研究手段。本文对已有Boussinesq类模型的研究进行了评述,深入探讨其重要发展、实际应用和理论瓶颈,从高阶非静压修正、GPU准三维高性能算法编译、波浪破碎和泥沙运移沉积等4个方面提出未来可能的科学突破方向。  相似文献   

4.
水面的模拟历来都是一个难题。近几年,随着图形处理器(GPU)的迅速发展,它的功能不再局限于图形处理,而是进入到了通用计算领域,所以可以利用GPU的并行计算优势来加速水面的模拟过程。本文研究的主要内容是海浪的实时模拟绘制。海浪渲染算法使用了投影网格技术,使用CUDA并行计算方法对投影网格顶点坐标的计算进行加速,比较使用CPU进行大数据量计算和使用GPU进行大数据量计算的速度差异。最终,改进后的程序渲染速度大幅提高,使得程序可以在生成更逼真画面的同时保持令人满意的帧率。  相似文献   

5.
强非线性和色散性Boussinesq方程数值模型检验   总被引:1,自引:1,他引:0  
采用同位网格有限差分法,建立了强非线性和色散性Boussinesq方程数值计算模型。以稳恒波Fourier近似解给定入射波边界条件,对均匀水深深水和浅水域不同非线性的行进波、缓坡地形上深水至浅水域的浅水变形波、以及缓坡和陡坡地形上的波浪水槽实验进行了数值计算,并将计算结果与解析解、解析数值解以及实验值进行了较为详细的比较,从而检验了模型的色散性、非线性以及不同底坡下非线性波的浅水变形性能。  相似文献   

6.
适合中等水流的Boussinesq方程   总被引:2,自引:0,他引:2  
推导了含量阶为O(ε1/2)的瞬变非均匀流的Boussinesq水波方程,讨论了该量阶水流对流场速度和压力分布的影响,采用了Crank-Nicolson格式的预估-校正有限差分法对该方程进行了数值求解.把数值结果与无水流情况的实验结果进行了对比,验证了该方程和数值计算方法的有效性,与经典的Boussinesq方程和含量阶为O(1)的瞬变非均匀流的Boussinesq水波方程的计算结果进行了比较,考察了该方程的适用范围.  相似文献   

7.
在Liu和Fang推导的双层Boussinesq方程基础上,将其简化为一层水波方程,并建立了基于混合4阶Adams-Bashforth-Moulton时间格式的立面二维数值模型;数值模拟了波浪在潜堤上的演化过程,并将数值计算结果与相关实验结果进行了对比,验证了该数值模型的正确性。进而在不同的入射波条件下,将沿着水深分布的水平速度和垂向速度的数值模拟结果与线性、二阶、三阶解析解解析结果进行综合对比。对比结果表明,在不同的无因次水深kh条件下,数值解与解析解的整体吻合程度较好。在不同的波陡H/L条件下,数值解展现了较好的非线性特征。在不同的波高水深比H/h条件下,数值解与解析解之间的整体差异较小。可以看到,该数值模型较好地模拟了波浪垂向速度场分布,体现了其优良的综合性能。  相似文献   

8.
基于改进型的二阶Boussinesq方程,在交错网络下建立数值模型.利用模型模拟波浪在常水深情况下的传播,波浪反射系数均低于2%.利用该模型模拟波浪在平斜坡前的反射,并将数值结果与解析解进行对比.结果表明,对于相对水深较大情况,坡度较陡时模拟结果明显偏大;对 于相对水深较小情况,坡度超过1:1时,数值结果仍与解析解有....  相似文献   

9.
Liu等给出的最高导数为2的双层Boussinesq水波方程具有较好的色散性和非线性,基于该方程建立了有限差分法的三维波浪数值模型。在矩形网格上对方程进行了空间离散,采用高阶导数近似方程中的时、空项,时间积分采用混合4阶Adams-Bashforth-Moulton的预报—校正格式。模拟了深水条件下的规则波传播过程,计算波面与解析结果吻合较好,反映出数值模型能很好地刻画波面过程及波面处的速度变化;在kh=2π条件下可较为准确获得沿水深分布的水平和垂向速度,这与理论分析结果一致。最后,利用数值模型计算了规则波在三维特征地形上的传播变形,数值结果和试验数据吻合较好;高阶非线性项会对波浪数值结果产生一定的影响,当波浪非线性增强,水深减少将产生更多的高次谐波。建立的双层Boussinesq模型对强非线性波浪的演化具有较好的模拟精度。  相似文献   

10.
实际工程中存在大量的曲边界,因此在曲边界上的计算准确性可以考察出一个数值模型的实用价值。利用Beji的改进型Boussinesq方程建立了一个有限元方法的数值波浪模型。造波方面采用Fenton提出的非线性规则波浪解;在墙边界处,以求解法线方向和切线方向的速度和导数代替求解x、y方向的速度和导数,从而使边界条件直接适用、严格满足,保证了对曲边界计算的准确性。"重开始广义极小残量法"的使用保证了求解方程组的效率和精度,使造波和边界处理方法的有效性和准确性得到了合理地诠释。通过与试验数据、他人数值结果、解析解的比对,显示出该模型计算稳定、结果准确,真正体现出了有限元方法对曲边界适用的优势。  相似文献   

11.
三维自由面流动模拟中GPU并行计算技术   总被引:1,自引:0,他引:1       下载免费PDF全文
MPS(Moving Particle Semi-implicit)法能够有效地处理溃坝、晃荡等自由面大变形流动问题。在三维MPS方法中,粒子数量的急剧增加会导致其计算效率的降低并限制其在大规模流动问题中的应用。基于自主开发的MPS求解器MLParticleSJTU,本文对求解过程中耗时最多的邻居粒子搜寻和泊松方程求解两个模块采用了GPU并行加速,详细探讨了CPU+GPU策略。以三维晃荡和三维溃坝这两种典型的自由面大变形流动为例,比较了CPU+GPU相对于MLParticle-SJTU串行求解时的加速情况,结果表明CPU+GPU在邻居粒子和泊松方程这两个模块中的加速比最高能达到十倍左右。此外,采用CPU+GPU并行能够较准确地模拟溃坝、晃荡等自由面大变形问题。  相似文献   

12.
This study presents an efficient Boussinesq-type wave model accelerated by a single Graphics Processing Unit (GPU). The model uses the hybrid finite volume and finite difference method to solve weakly dispersive and nonlinear Boussinesq equations in the horizontal plane, enabling the model to have the shock-capturing ability to deal with breaking waves and moving shoreline properly. The code is written in CUDA C. To achieve better performance, the model uses cyclic reduction technique to solve massive tridiagonal linear systems and overlapped tiling/shared memory to reduce global memory access and enhance data reuse. Four numerical tests are conducted to validate the GPU implementation. The performance of the GPU model is evaluated by running a series of numerical simulations on two GPU platforms with different hardware configurations. Compared with the CPU version, the maximum speedup ratios for single-precision and double-precision calculations are 55.56 and 32.57, respectively.  相似文献   

13.
基于MPI的LAGFD-WAM海浪数值模式并行算法研究   总被引:5,自引:0,他引:5  
在LAGFD-WAM海浪串行数值模式基础上,利用MPI信息传递机制实现其并行化。通过对模拟区域合理划分,对数据采取分块加载,实现了各个节点的负载平衡;通过对算法的改进实现了粗粒度计算,大幅度减少了通信量,从而提高了程序的执行效率。对串行计算和并行计算的效率比较表明,本文建立的方法能够得到较高的加速比。对全球海浪模式,加速比和CPU数目大致呈线性关系。对高分辨率的区域海浪模式,在128 CPU条件下加速比可以达到91.9。  相似文献   

14.
实际地下储层是含流体的双相介质,常规的弹性波叠前逆时偏移多基于单相介质理论,不能充分考虑地层中的双相介质对地震波场的影响。为研究双相介质中地震波传播对逆时偏移结果的影响,基于Biot的双相介质理论实现了一阶速度-应力双相介质方程的逆时偏移,并基于CUDA实现了双相介质方程逆时偏移的GPU加速。模型实验结果表明,在含流体的双相介质中,双相介质方程逆时偏移的结果比弹性波方程和声波方程的结果更接近真实的构造形态,同时与基于CPU的双相介质逆时偏移相比,基于GPU的逆时偏移可达到27倍的加速比。因此基于GPU加速的双相介质逆时偏移不仅能够实现对双相介质地层的精确偏移成像,而且能够有效提高逆时偏移的计算效率。  相似文献   

15.
From the phase-resolving improved Boussinesq equations (Beji and Nadaoka, Ocean Engineering 23 (1996) 691), a phase-averaged Boussinesq model for water waves is derived by more effectively describing carrier wave groups and accompanying long wave evolution with less CPU time. Linear shoaling characteristics of carrier wave equations are investigated and found to agree exactly with the analytical expression obtained from the constancy of energy flux for the improved Boussinesq equations themselves, showing that the present model equations are the results of a consistent derivation procedure regarding energy considerations. Numerical simulations of the derived equations for the single wave group and narrow-banded random waves show the validity of the present model and its high performance, especially on the CPU time.  相似文献   

16.
使用序列化和不规则矩形划分的方法,开发了基于消息传递接口(MPI)的环流数值模式并行算法,并通过邻近点交换策略(NPES)进一步提升了计算效率。在HP C7000刀片系统上设计了两个实验,数值结果表明,使用了NPES的并行版本(PVN)的计算效率要高于原并行版本(PV)。在第二个实验中当进程数为100时PVN的计算效率仍可达到0.9以上,然而此时PV的计算效率已迅速下降至0.39。并用环流模式的PVN版本对一个高分辨率的区域进行了模拟,效果较好。该算法具备普适性,可用于其它环流模式的高效并行。  相似文献   

17.
分别采用非差无电离层组合模型与非差非组合模型进行批量静态定位解算,对比两者的定位精度以及ZPD估计精度。设计并实现两种模型的并行解算方法,提高非差模型的计算效率。大网数据实验结果表明,两种模型定位精度基本一致,非差非组合ENU的3个方向平均偏差为(4.2,2.8,6.6)mm,组合模型的平均偏差为(4.0,2.8,6.3)mm,但非差非组合模型的解算更加耗时,约是组合模型计算时间的1.4倍。多核环境下,两种模型的并行解算效率均比传统串行模型得到了提高。结果表明,双核并行和四核并行的计算效率比单核串行计算均分别提高了40%和60%以上。  相似文献   

18.
合成孔径雷达在海洋环境监测和海洋研究中扮演着越来越重要的角色。受其成像机制的影响,合成孔径雷达图像总是受到斑点噪声的污染。斑点噪声的存在会增大目标识别、跟踪和分类的难度,也会降低雷达信号的信噪比。合成孔径雷达海洋图像具有一些特殊的性质:海洋现象在雷达图像中主要呈现为条带状或斑块状的结构。这些条带状或斑块状的结构呈现出高度的自相似性或信息冗余。非局部平均方法能够衡量图像中不同图像块之间纹理结构的相似性,并利用图像的自相似性对图像进行去噪。但非局部平均去燥方法存在计算量巨大、计算耗时长的缺点,这几乎限制了其实际应用。本文采用一种自适应方法将雷达图像中的像素点区分为纹理区像素点和平坦区像素点。对纹理区像素点,采用较大的相似窗和搜索窗,对平坦区像素点,采用较小的相似窗和搜索窗,从而提高计算速度。进一步,本文基于计算统一设备并行架构(CUDA)技术,利用计算机图形处理器(GPU)对前述算法进行并行加速。与经典非局部平均算法相比,加速后算法的计算效率提高了200倍。  相似文献   

19.
A numerical scheme for solving the class of extended Boussinesq equations is presented. Unlike previous schemes, where the governing equations are integrated through time using a fourth-order method, a second-order Godunov-type scheme is used thus saving storage and computational resources. The spatial derivatives are discretised using a combination of finite-volume and finite-difference methods. A fourth-order MUSCL reconstruction technique is used to compute the values at the cell interfaces for use in the local Riemann problems, whilst the bed source and dispersion terms are discretised using centred finite-differences of up to fourth-order accuracy. Numerical results show that the class of extended Boussinesq equations can be accurately solved without the need for a fourth-order time discretisation, thus improving the computational speed of Boussinesq-type numerical models. The numerical scheme has been applied to model a number of standard test cases for the extended Boussinesq equations and comparisons made to physical wave flume experiments.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号