首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
基于GPU的HASM动态模拟与实时渲染方法   总被引:1,自引:0,他引:1  
 基于微分几何曲面论的高精度曲面模拟(high accuracy surface modeling, HASM)需要大量的复杂密集计算,在CPU上模拟极为耗时,使得在现有的硬件条件下,实时动态模拟曲面并实时可视化极具挑战性。论文提出了GPU加速的HASM方法,充分利用现代显示适配器(graphic processor unit, GPU)技术,运用GPU最新发展起来的并行计算能力,使用并行化的预处理共轭梯度方法解算曲面,完成曲面模拟,并同时利用GPU的高速缓存架构,对渲染操作进行充分优化,以实现高效实时可视化。HASM需要的有限差分离散和高速解算操作,均充分利用现代GPU架构,所具有的多处理器和众多的流处理器所产生的强大并行计算能力,可视化也用GPU高速缓存技术和三角条带方法进行充分优化。数值实验和实际项目区高程模拟实验均表明, 在GPU为NVIDIA quadro 2000和CPU为DualCore Intel Core 2 Duo E8400的硬件配置下,GPU并行化的曲面模拟方法比普通方法速度提高了约10倍,使得动态模拟与可视化算法可以达到交互式的帧速及实时可视化的要求。  相似文献   

2.
传统的基于CPU的串行程序所实现的二维DCT变换算法时间复杂度高变换效率低,难以满足许多应用的实时要求.特别是在当代以嵌入式处理器为核心的移动端信息处理终端,有限的CPU性能更加难以实现快速的DCT变换.值得欣慰的是新一代嵌入式处理器提供了支持GPGPU技术的GPU,为解决复杂的移动计算问题提供了高效的并行化解决途径.基于最新的ARM Cortex-A15内嵌GPU Mali-T604及OpenCL框架设计实现了一种针对二维DCT变换的并行化加速方案并实测了优化效果,实验结果表明文中的并行方案能够提高二维DCT变换的效率,在输人数据量足够大的条件下能够达到近20倍的加速比.  相似文献   

3.
传统的基于CPU的串行程序所实现的二维DCT变换算法时间复杂度高变换效率低,难以满足许多应用的实时要求。特别是在当代以嵌入式处理器为核心的移动端信息处理终端,有限的CPU性能更加难以实现快速的DCT变换。值得欣慰的是新一代嵌入式处理器提供了支持GPGPU技术的GPU,为解决复杂的移动计算问题提供了高效的并行化解决途径。基于最新的ARM Cortex-A15内嵌GPU Mali-T604及Open CL框架设计实现了一种针对二维DCT变换的并行化加速方案并实测了优化效果,实验结果表明文中的并行方案能够提高二维DCT变换的效率,在输入数据量足够大的条件下能够达到近20倍的加速比。  相似文献   

4.
三维数据场可视化中的体绘制技术是科学计算可视化领域最重要的一项技术。由于体绘制技术需要处理的数据量十分庞大,生成图像算法又比较复杂,常常需要使用高端图形工作站和特殊硬件来实现。近年来计算机性能的大幅提高,特别是可编程GPU的顶点和片段处理器的快速发展,为普通Pc机上实现实时体绘制技术提供了硬件加速的支持。介绍了科学计算可视化和可编程GPU的概况,在普通PC机上实现了基于GPU的三维纹理映射的体绘制算法,实验表明,在不损失图像绘制质量的情况下,加快了绘制的速度。  相似文献   

5.
正北京超图软件股份有限公司研发的高性能GIS技术,融合了内存计算、并行计算、GPU计算和高性能算法(图1),其研制的高性能GIS内核,整合发挥计算机大内存、多CPU、多核和显卡的高性能计算能力,显著提升空间数据处理的性能。SuperMap GIS内核构建了全新的基于内存计算(即64位计算)的GIS数据结构与算法,充分利用64位计算环境的大内存寻址能力和更高的指令处理带宽,  相似文献   

6.
基于GPU并行加速的叠前逆时偏移方法   总被引:1,自引:1,他引:0  
为了提高复杂地下介质的成像精度和偏移算法的计算效率,提出可高效对地下复杂构造进行准确成像的GPU加速叠前逆时偏移方法.该方法采用双程声波方程进行波场延拓,突破倾角限制,借助于高阶有限差分方法实现叠前逆时偏移成像;利用GPU(Graphic Processing Unit)并行加速技术对波场延拓和成像进行计算,相比于传统算法,其计算效率有较大提高,可以解决叠前逆时偏移算法计算量过大问题;在获取波场信息过程中,也采用随机边界条件,实施以计算换存储策略,解决逆时偏移计算中的海量存储问题.模型测试结果表明,该方法能够高效和高精度地对地下复杂地质体成像.  相似文献   

7.
S63标准采用Blowfish算法对原始海图数据加密后发行,数据的解密成为电子海图系统数据转换和更新中一个耗时的过程。为提高数据处理的速度,针对Blowfish分组密码算法的特点,提出一种利用图形处理器(GPU)的海图并行解密算法,并采用数据传输和处理的同步技术进行了优化。测试表明,采用GPU的并行解密算法是纯CPU串行处理的9.8倍。该算法不仅可大大加快海图数据转换和更新过程,对地理信息系统海量数据处理也有一定的借鉴价值。  相似文献   

8.
在对基于GPU大规模地形数据快速绘制方法的研究基础上,针对GPU的批量绘制的特点,提出了改进的几何体实例化方法,把它用在全球格网的快速绘制上。把地形数据通过重新编码存储在高度图中,再结合Shader Model 3.0引入的顶点纹理拾取技术,在GPU中进行解码,得到原始的DEM数据,避免了在CPU上执行顶点缓存的更新。实验证明该算法充分利用了新一代GPU的特性,降低了CPU的负担,能达到实时绘制的要求。  相似文献   

9.
本文从地幔是牛顿粘滞层状流体出发,根据流体动力学推导出重力扰动位和岩石圈底面地幔流应力场的基本关系;利用地球重力场模型资料将重力扰动位两个水平导数T_z、T_y,向下延拓到岩石圈底面处,从而得到岩石圈底面地幔流应力计算新模式。  相似文献   

10.
空间聚类是空间数据挖掘的重要方法,而K-Medoids是一种常用的空间聚类算法。K-Medoids聚类算法存在初始点选择问题,而且计算复杂。为了提高算法的有效性和时间效率,本文结合模拟退火算法思想,改进了传统的K-Medoids算法PAM,提出一种基于GPU计算的并行模拟退火PAM算法。类比矩阵乘法运算,定义了一种新的矩阵计算方法,可以有效减少数据在GPU全局内存和共享内存之间的传输,提高了算法在GPU中的执行效率。利用模拟退火算法搜索聚类中心点,保证了聚类结果的全局最优性。基于不同的数据集,将串行和并行模拟退火PAM算法以及已有的遗传PAM算法进行比较,结果表明并行模拟退火PAM算法聚类结果正确,且时间效率高。最后,应用本文改进算法对贵州省安监系统的安全监管隐患数据进行聚类分析,发现了隐患聚集中心,相关结果对政府的决策具有一定的实际应用价值。  相似文献   

11.
地统计面插值算法在空间统计分析中有广泛应用,其目的是通过一组面要素的某已知属性值估算另一组面要素的属性值。地统计面插值算法多是基于克里金(Kriging)插值及其衍生算法。克里金插值算法考虑属性在空间位置上的变异性,需计算要素之间的协方差,是典型的计算密集型算法。本文分析了基于克里金插值的地统计算法计算过程,该算法中面要素间协方差计算相互独立,可作为并行计算单元划分。另外,面要素间协方差计算可使用快速傅里叶变换(FFT)快速计算,而FFT是一种非常适合并行处理的计算密集型算法。本文根据算法特征设计了基于异构集群计算的并行算法,并使用MPI+CUDA实现了该算法。实验结果表明,本文实现的算法比使用MPI实现的CPU集群的算法有更好的性能,具备良好的可扩展性,并且随着插值精度提高表现出更好的性能。  相似文献   

12.
伴随着无人机时代的到来,对海量数据处理的实时性要求越来越高。本文在GPU(Graphic Processing Unit)平台上实现了Retinex图像增强算法的并行处理,提升了Retinex图像增强算法处理高分辨率数字图像的处理速度。首先,通过数据合并访问和内存数据交互技术实现了数据的快速访问,缩短了数据在不同种类内存间的传输时间,提升了数据访问的效率;然后,采用内核指令优化和数据并行计算技术,实现了Retinex图像增强算法在GPU平台上的多核程序设计;最后,采用主机端和设备端的异步执行模式,在数据传输的同时进行内核数据的并行计算,通过任务级的并行进一步缩短了算法在GPU平台上的执行时间。研究表明,对于不同分辨率的图像,Retinex图像增强算法的处理速度相比于CPU平台均有数十倍的提高,如处理一帧分辨率为2048像元×2048像元的图像仅需要38.04 ms,算法的处理速度较CPU提高了40倍。  相似文献   

13.
Vatti算法是常用的矢量多边形裁剪算法之一,在其构建扫描束实现交点计算的过程中,二叉树的数据结构和递归计算方法导致其计算效率受矢量多边形边界顶点数量影响显著。本文针对Vatti算法执行过程中较为耗时的扫描束构建环节,提出了一种多边形边界顶点预排序的优化方法——VCS(Vertex Coordinate Pre-Sorting)方法,并基于该方法实现了对Vatti算法的GPU细粒度并行化。VCS方法使用双向链表对Vatti算法原有的二叉树数据结构进行了替换,以较小的额外存储空间取得了多边形边界顶点信息查找效率的明显提升。在GPU环境下采用双调排序算法对多边形边界顶点数组元素进行并行化排序并过滤出有效值,克服了原始算法使用二叉树存储导致效率低下的问题。实验结果表明,改进后的算法与原始算法相比,具有相同的计算精度;当多边形顶点数量为92万,CUDA每个线程块中的线程数量为32时,使用VCS优化方法,与采用CPU计算构建扫描束方法相比,GPU并行化方法获得了39.6倍的相对加速比,矢量多边形叠加分析算法效率总体上提升了4.9倍。  相似文献   

14.
在利用卫星跟踪卫星资料解算重力场模型位系数时,其海量观测数据处理以及大型方程组解算过程存在计算效率低下、对平台硬件要求高等问题。针对以上问题,提出一种基于能量守恒方法的重力场反演快速异构并行算法,基于CUDA 在GPU端实现并行计算设计矩阵,结合MKL库与分区平差法、预处理共轭梯度法在CPU端完成低内存消耗下的法方程快速构建与求解,实现重力场模型反演的异构并行计算。运用该算法处理GRACE-FO卫星2020-01-01~06-30期间观测数据,反演获得120阶重力场模型GM-GraceFO2020h;与现有模型以及算法对比分析表明,该算法所得模型与现有GRACE重力场模型精度相当,且相较于传统的串行算法,反演耗时减少98.479%,内存消耗减小1个数量级。  相似文献   

15.
 国家尺度土壤属性数据是地球生物化学循环及水循环等领域研究的重要数据,目前,该尺度土壤属性数据的获取方法主要有两类:土壤属性-空间数据连接法和空间插值。为了确定哪一类方法更适合稀疏样点的国家尺度土壤属性制图,本文以中国吉林省的土壤有机质含量制图为例,采用8~32km格网样点和1∶100万土壤图,对这两类方法进行对比分析。独立样本验证结果表明,土壤属性-空间数据连接法的平均误差(ME)大于距离反比加权(IDW)插值,而平均绝对误差(MAE)和均方根误差(RMSE)都小于IDW插值。IDW插值获得的土壤属性图虽然能大致反映土壤属性空间分布的基本规律,但出现了类似"牛眼睛"的空间结构,且存在无样点区估计值不准确等问题;土壤属性-空间数据连接法尽管忽略了同种土壤类型内部的差异,保留了不同土壤类型边界处的属性值突变,但获得的土壤属性图更能反映土壤属性分布的基本规律,也具有比较详细的土壤属性空间结构。因此,在基于稀疏样点的国家尺度土壤属性制图中,土壤属性-空间数据连接法的制图效果要优于IDW空间插值法。  相似文献   

16.
多年平均气温数据空间化误差的尺度效应   总被引:1,自引:0,他引:1  
属性数据空间化是利用矢量数据生成栅格数据产品的有效方法,它有助于不同来源、不同格式之间的数据的综合分析。空间化是一种必然有误差伴随的过程,为探讨空间化误差与数据源密度、空间化模型方法,以及空间化分辨率之间的关系,本文利用7种水平的气象站点密度、5种空间化模型方法和19种栅格分辨率分析多年平均气温数据空间化误差与这3类影响因子之间的关系。分析发现:(1)气象站点密度的降低导致多年平均气温数据的空间化误差增加;(2)在IDW、Kriging、Adjusted IDW、Regression和Anusplin 5种空间化模型方法中,Adjusted IDW、Regression、Anusplin比IDW、Kriging的精度高;(3)随着栅格分辨率的变粗,多年平均气温数据空间化误差增大;(4)在影响空间化精度的3类因子中,空间化模型方法对空间化精度的影响最大,栅格分辨率次之,气象站点密度的影响最小。通过多元回归分析,建立了多年平均气温数据空间化误差与这3类影响因子之间的定量模型,可为空间化技术方案的制定提供参考和依据。  相似文献   

17.
气温是最重要的气象因子之一,空间插值为台站气象数据降尺度提供了有效方法.本文利用江苏省67个气象台站2003年的逐日气温资料计算逐月平均气温和年平均气温,结合空间分辨率为30mX 30m的DEM数据,分别利用反距离权重法、张力样条插值法、普通克里格插值法和协同克里格插值法,对月和年平均气温进行插值,并利用交叉验证法对插...  相似文献   

18.
基于DEM修正的MODIS地表温度产品空间插值   总被引:1,自引:0,他引:1  
地表温度是资源环境、气候变化、陆地生态系统等科学研究的重要参数之一。MODIS LST(Land Surface Temperature, LST)产品是地表温度相关研究的重要数据源。而现有MODIS LST产品均存在云覆盖区域,因此云覆盖区域地表温度估计已成为热红外遥感的前沿性研究难题。为解决MODIS LST产品云遮挡区域地表温度信息缺失,以秦岭地区为研究区,选用2001-2017年的MOD11A2数据,在传统的反距离权重(IDW)、规则样条函数(SPLINE)、普通克里金(OK)、趋势面(TREND)空间插值方法中引入高程因子,通过反复试验形成基于DEM修正的MODIS LST空间插值方法。分析空间插值结果表明: ① 空间插值精度由高到低为:OK>SPLINE>IDW>TREND,基于DEM修正后精度分别提高了约0.38、0.31、0.32和0.78℃; ② 空间插值结果的精度呈现季节差异,夏季6、7、8月的精度较高,1月的精度最低;③ 插值精度与云区的范围存在一定的关系,当云覆盖区域<1.1 km2时,DEM+OK方法的插值误差<0.55 ℃,当云覆盖区域<3.1 km2,插值误差<1 ℃;DEM+SPLINE方法在云覆盖区域<2.7 km2时,插值误差<0.55 ℃,云覆盖区域<10.4 km2,插值误差<1℃;当云覆盖为1.1~2.7 km2时,DEM+SPLINE方法的插值精度高于DEM+OK方法。  相似文献   

19.
目前,空间关系查询中常用的Plane Sweep 算法是一种串行方法,而关于多核CPU的并行查询算法,在面对海量数据查询时,由于CPU核心数及线程数量的限制,其难以满足查询效率需求。针对该问题,本文提出了一种全新的异构多核架构多边形图层间空间关系查询的并行算法。首先,利用STR 树索引过滤不相交的多边形;然后,对过滤后多边形的线段构建四叉树索引,利用CPU+GPU架构并行计算线段的相交以判断多边形环间的拓扑关系;再根据环间的拓扑关系计算多边形间的维度扩展九交模型(DE-9IM)参数值,据此确定多边形间的空间关系;最后,通过实验验证了该算法的准确性和高效性。实验表明,本算法能有效缩短大数据量的空间查询时间。在实验中逐渐增加目标数据集和源数据集多边形的数量,当两数据集都为50 000 个多边形时,以包含关系为例,相比于ArcGIS,本文提出的算法可达到2 倍的加速比。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号