首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
并行效率的初步研究   总被引:1,自引:1,他引:1       下载免费PDF全文
用有限区域中尺度差分网格模式,采用分区域并行计算方法,在TRANSPUTER并行计算机上研究大规模并行计算中计算问题复杂度与并行计算效率的关系。结果表明,采用适当的并行计算法,增加处理机个数和计算问题的复杂度可使并行加速比增大;并行效率则随着处理机个数的增加而降低,随着计算问题复杂度的增加而提高;大规模并行计算能明显地提高计算速度,很适合于解决大量计算的问题,在数值预报方面具有广阔的发展前景。  相似文献   

2.
在大规模集群高性能计算机系统上进行WRF模式并行计算测试,研究WRF模式不同水平分辨率和垂直分辨率与并行计算时间、并行加速比和并行效率的关系。测试结果表明,随着并行计算使用计算核心个数的增加,并行计算时间减少,并行加速比增大,并行效率则降低;在使用计算核心个数相同的情况下,随着水平分辨率的提高,WRF模式并行计算时间增加,并行加速比增大,并行效率也提高。  相似文献   

3.
从理论上讲 ,在多节点多处理器并行计算机系统上用MPI/OpenMP进行混合并行编程 ,即在节点间用MPI通信 ,而节点内用OpenMP ,应该取得比用纯MPI并行化的应用程序更好的并行性能。目前 ,各国的应用程序开发者和气象工作者们都在致力于这方面的研究。可以说 ,这种方法的可行性是不容置疑的 ,它应当是今后并行编程框架设计的共同趋势。本文介绍了在IBMSP并行计算机上优化和并行化高分辨率有限区同化预报系统(HLFAS)中模式所采用的这种混合编程方法和技术。1 HLAFS系统高分辨率有限区同化预报系统包括资料分…  相似文献   

4.
一个有限差分大气环流模式的并行效率   总被引:2,自引:0,他引:2  
适合于大规模并行处理机(MPP)的中国科学院大气物理研究所新一代九层大气环流模式(IAP 9L AGCM)被发展成功。本文描述了并行模式的设计原则,给出了该模式的并行版本在我国几种主要的并行机上的并行执行效率数据。采用消息传递方式(MPI)的区域分解方法用于实现程序的并行,结果表明,对于该模式,只有一维区域分解方法才能取得较好的并行可扩展性,即随着处理器的增加而能得到相应较好的并行加速比和并行效率。  相似文献   

5.
一种在异构系统中实现负载平衡的方法   总被引:2,自引:3,他引:2       下载免费PDF全文
提出了在异构系统实现负载平衡的区域分解算法和实现负载平衡的计算方法,利用它的负反馈性质解决了异构系统处理机计算速度测量误差造成的负载测量不准问题,并对处理机速度变化,速度测量误差、处理机数量、网格点计算量的分布等因素的影响进行了计算,结果表明本方法具有很强的平衡负载能力和较强的适应性;根据计算结果提出了解决模式网格点计算量不易测量问题的解决方案,并用扩散方程和模拟物理过程进行试验,试验表明这种方法是可行的,平衡负载的效果十分显著。  相似文献   

6.
随着多核计算技术的发展,基于多核处理器的集群系统逐渐成为主流架构。为适应这种既有分布式又有共享内存的硬件体系架构,使用MPI与OpenMP混合编程模型,可以实现节点间和节点内两级并行,利用消息传递与共享并行处理两种编程方式,MPI用于节点间通信,OpenMP用于节点内并行计算。该文采用MPI与OpenMP混合并行模型,使用区域分解并行和循环并行两种方法,对GRAPES全球模式进行MPI与OpenMP混合并行方案设计和优化。试验结果表明:MPI与OpenMP混合并行方法可以在MPI并行的基础上提高模式的并行度,在计算核数相同的情况下,4个线程内的MPI与OpenMP混合并行方案比单一MPI方案效果好,但在线程数量大于4时,并行效果显著下降。  相似文献   

7.
一种适用于有限差分模式的负载平衡区域分解方法   总被引:6,自引:1,他引:6  
金之雁  王鼎兴 《气象学报》2002,60(2):188-193
分布式内存并行处理在数值天气预报等超大规模科学计算中已经得到了广泛的应用。中尺度模式由于分辨率高 ,计算量大 ,需使用更多的处理机进行并行运算。另一方面 ,由于复杂的物理过程的采用 ,增加了不同天气的计算量的不平衡。但是 ,目前所广泛使用的并行处理方法在处理机数量较多时不能很好地均衡计算负载 ,引起并行计算效率的降低。本文提出了一种新的非规则区域分解负载分配方法。并与已有的负载分配方法进行了分析试验对比 ,该方法能更有效地平衡负载 ,取得更好的加速效果  相似文献   

8.
本文参照IBM公司提供的部分软硬件资料,主要介绍处理机、存贮器、接口、操作系统及程序设计等方面的功能. 一、IBM series/I系统概述 IBM series/I系统是小型通用计算机与各种输入/输出设备及I/O接口能力的总称.系统主要配备有:硬件浮点设备、200M硬盘、数字磁带机、模拟磁带机、IBM-PC/AT、图像显示器、高低速通信接口及终端设备.操作系统为EDX系统,配有各  相似文献   

9.
近年来,计算机系统处理器速度、内存速度及内存容量发展极快,每2~3年翻一番,而磁盘I/O速度却受盘片旋转和动臂机械性质的限制,增长缓慢,影响了计算机整体性能,急需提高磁盘存储系统的I/O,(响应速度和数据传输速率。另一方面,当今信息时代信息量呈指数增长,并且随着影像、文字、图形及声音等多媒体数据资料在计算机中的广泛应用,资料储存的成本及安全性要求愈来愈重要,急需廉价、高可靠性、大容量的存储系统。廉价冗余磁盘阵列(RedundantArrayofInexpensiveDisks简称RAID)以其数据传输率高、存储容量大、可靠性高及价…  相似文献   

10.
现在,地球科学家正试图解决一些问题,而这些问题即便利用当前最高档的超级计算机来处理,也会感到十分棘手。为了进一步提高计算机的处理速度就必须引入并行处理技术。本文引用Ware的并行处理模型旨在说明:在所用的各个模型完全是高度并发的(highly concurrent)并且通过任务管理系统减少额外开销的条件下,使用含16个处理器并共享一个存储器的超级计算机可将计算速度提高一个数量级。本文还介绍一种高度并行阵列结构的计算机——联接机(CM),以及简述开发这种计算机的潜力以提供比当今计算机更高的计算速度的计划。  相似文献   

11.
The design and implementation of a high-performance Input/Output (I/O) library for the Korean Integrated Model (KIM, KIM-IO) is described in this paper. The KIM is a next-generation global operational model for the Korea Meteorological Administration (KMA). The horizontal discretization of KIM consists of the spectral-element method on the cubed-sphere grid. The KIM-IO is developed to be a consistent and efficient approach for input and output of essential data in this particular grid structure in a multiprocessing environment. The KIM-IO provides three main features, comprising the sequential I/O, parallel I/O, and I/O decomposition methods, and adopts user-friendly interfaces similar to the Network Common Data Form (NetCDF). The efficiency of the KIM-IO is verified using experiments to analyze the performance of its three features. The scalability is also verified by implementing the KIMIO in the KIM at a resolution of approximately 12 km using the 4th supercomputer of KMA. The experimental results show that both regular parallel I/O and sequential I/O undergo performance degradation with an increasing number of processes. However, the I/O decomposition method in the KIM-IO overcomes this degradation, leading to improvement in scalability. The results also indicate that with using the new I/O decomposition method, the KIM attains good parallel scalability up to Ο (100,000) cores.  相似文献   

12.
杨昕 《气象科技》2006,34(Z1):27-30
GPFS(通用并行文件系统)普遍应用于IBM大规模集群系统中,能够为并行应用程序提供高性能的I/O存取访问。该文介绍了GPFS的原理和工作机制,并以安装在国家气象信息中心的IBM高性能计算机系统为试验平台,初步测试了在实际环境中GPFS的应用情况,在应用程序中对文件访问进行性能优化的方式有2种:①由主任务负责全部文件访问,②通过MPI-IO在GPFS中实现并行文件访问。测试结果表明,GPFS可以提供很好的文件访问支持,但要想获得较高的性能,需要在应用程序中进行深入调试。  相似文献   

13.
This paper describes the model speed and model In/Out (I/O) efficiency of the high-resolution atmospheric general circulation model FAMIL (Finite-volume Atmospheric Model of IAP/LASG) at the National Supercomputer Center in Tianjin, China, on its Tianhe-1A supercomputer platform. A series of three-model-day simulations were carried out with standard Aqua Planet Experiment (APE) designed within FAMIL to obtain the time stamp for the calculation of model speed, simulation cost, and model I/O efficiency. The results of the simulation demonstrate that FAMIL has remarkable scalability below 3456 and 6144 cores, and the lowest simulation costs are 1536 and 3456 cores for 12.5 km and 6.25 km resolutions, respectively. Furthermore, FAMIL has excellent I/O scalability and an efficiency of more than 80% on 6 I/Os and more than 99% on 1536 I/Os.  相似文献   

14.
GRAPES全球格点模式的并行计算负载平衡策略   总被引:1,自引:0,他引:1  
随着高性能计算机技术的发展和应用,并行计算已成为保证数值天气预报模式业务运行时效的关键技术之一.目前高性能计算机计算能力已达到每秒千万亿次浮点计算.系统中处理器数量也早已达十万甚至更多,如此巨大的计算资源对应用软件系统的设计也提出了挑战.数值天气预报软件系统要充分利用高性能计算机提供的计算资源,必须依靠并行计算方法,这包括适合计算问题的可扩展并行算法的设计、合适的数据分配方案以及良好的任务负载平衡方案.作为中国新一代数值天气预报格点模式,GRAPES(Global and Regional Assimilation and PrEdiction System)设计的最终目标是一个科研/业务通用,区域/全球通用模式.作为一个格点模式,GRAPES的并行计算具有与欧洲中期数值顶报研究中心谱模式并行计算不同的特点,GRAPES的并行计算采用了经典的水平网格数据划分.但对于全球的GRAPES模式,由于采用拉格朗日差分方案,模式极地及附近区域格点与格点之间距离的减小.使得模式并行计算在采用简单的经纬网格划分方式实现时,必须考虑极地区域并行计算跨越多个处理器时导致的频繁通讯解决途径.本研究提出了利用消息传递组通讯实现全球格点模式并行计算的一种方法,其核心思想是将极点附近一定区域内的处理器按纬向划归不同的处理器组.文中还给出了该实现方法的任务分配算法,提出了改进的任务分配负载平衡方案.在中国气象局高性能计算机IBM-cluster1600上的测试表明,算法具有较好的可扩展性,其负载平衡方案改善了计算的绝对墙钟时间,使并行计算效率提高10%以上.模式的准业务运行结果表明计算墙钟时间基本可以满足数值预报业务的实时性要求.  相似文献   

15.
针对电力无线通信网络多跳传输不可靠的问题,提出了一种基于Mesh的免重传的多跳高效传输技术.该技术在源节点、接收节点之间布设备份节点,设计全新的免重传协议,使得所有节点根据监听/接收到的ACK/NACK信息自动识别自己的下一步状态,从而在不增加任何网络信令开销的情况下,有效降低了每个数据块的平均传输总次数,提升了电力无线通信网络的深覆盖、低时延、高可靠的业务传输能力.最后通过仿真计算得出,随着误块率的增大,免重传多跳高效传输技术的平均传输总次数较传统方案得到了明显改善,即明显降低平均端到端时延,具有很好的实际应用价值.  相似文献   

16.
原始方程模式多处理器的并行计算方案设计及试验   总被引:1,自引:0,他引:1       下载免费PDF全文
矫梅燕  李国杰  林洪 《大气科学》1995,19(5):623-630
本文介绍并行处理器(Transputer芯片)的性能和特点,及其对微机功能扩充上的应用。结合气象问题,设计了五层原始方程数值预报模式的并行计算方案。经过试验,计算速度明显提高,结果正确可靠,从而为省级气象部门的数值预报业务化及科学研究提供了一条有效途径。  相似文献   

17.
The Spectral Statistical Interpolation (SSI) analysis system of NCEP is used to assimilate me-teorological data from the Global Positioning Satellite System (GPS/MET) refraction angles with thevariational technique. Verified by radiosonde, including GPS/ME% observations into the analysis makesan overall improvement to the analysis variables of temperature, winds, and water vapor. However, thevariational model with the ray-tracing method is quite expensive for numerical weather prediction andclimate research. For example, about 4 000 GPS/MET refraction a;~gles need to be assimilated to producean ideal global analysis. Just one iteration of minimization will take more than 24 hours CPU time onthe NCEP‘s Cray C90 computer. Although efforts have been taken to reduce the computational cost, it isstill prohibitive for operational data assimilation. In this paper, a parallel version of the three-dimensional variational data assimilation model of GPS/MET occultation measurement suitable for massive parallelprocessors architectures is developed. The divide-and-conquer strategy is used to achieve parallelism and isimplemented by message passing. The authors present the principles for the code‘s design and examine theperformance on the state-of-the-art parallel computers in China. The results show that this parallel modelscales favorably as the number of processors is increased. With the Memory-IO technique implemented bythe author, the wall clock time per iteration used for assimilating 1420 refraction angles is reduced from45 s to 12 s using 1420 processors. This suggests that the new parallelized code has the potential to beuseful in numerical weather prediction (NWP) and climate studies.  相似文献   

18.
高性能并行计算,一直是气候系统模式研究中的重要科学前沿。然而,随着计算机技术的发展,计算机体系结构越来越复杂,以及气候系统模式本身的复杂性使得开发高性能气候系统模式成为一个难题。采用了一种全新的并行程序设计方法:基于针对气象科学中的计算特点发展出的领域编程框架J-Earth,构建了高性能并行大气环流模式H-GAMIL。在对原模式GAMIL分析和解构以后,结合J-Earth的特点,采用面相对象的编程方式,对H-GAMIL进行重构。重构后的H-GAMIL具有现代软件标准化模块化的特点,并具有自动二维剖分、MPI(Message Passing Interface)和Open MP(Open Multi-Processing)混合并行实现、并行输出等新功能。解决了原模式一维剖分受到处理器限制,串行IO等问题。在此基础上,本文对H-GAMIL进行了并行效率测试,结果显示,模式水平分辨率为1°(纬度)×1°(经度)时,可使用上千处理器核,并行效率达40%以上且负载平衡达70%。测试结果表明了H-GAMIL具有较好的并行效率和可扩展性;同时对H-GAMIL模拟性能进行对比分析,其结果表明H-GAMIL保持了原模式的守恒性,并且具有与原模式相当的模拟性能,能够满足气候研究的计算需求,达到实用程度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号