CFD2011-第13讲-MPI并行程序设计初步

CFD2011-第13讲-MPI并行程序设计初步

ID:38548880

大小:4.98 MB

页数:56页

时间:2019-06-14

CFD2011-第13讲-MPI并行程序设计初步_第1页
CFD2011-第13讲-MPI并行程序设计初步_第2页
CFD2011-第13讲-MPI并行程序设计初步_第3页
CFD2011-第13讲-MPI并行程序设计初步_第4页
CFD2011-第13讲-MPI并行程序设计初步_第5页
资源描述:

《CFD2011-第13讲-MPI并行程序设计初步》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、计算流体力学讲义2011第13讲MPI并行程序设计(1)李新亮lixl@imech.ac.cn;力学所主楼219;82543801知识点:MPI程序的运行机制——拷贝N份,给每个进程一份MPI的基本库函数——6个库函数“对等式”编程方法——站在单个进程的角度思考1讲义、课件上传至www.cfluid.com(流体中文网)->“流体论坛”->“CFD基础理论”CopyrightbyLiXinliangCopyrightbyLiXinliang2Part1:基本概念及MPI并行编程入门并行计算基本概念MPI并行编程入门1)MPI简介2)MPI的基本函数及

2、消息传递3)MPI的常用函数4)对等式编程思想的举例说明——全收集、矩阵相乘一、基本概念并行计算机简介大规模并行计算——超级计算(Supercomputing)/高性能计算(HPC)为何需要超级计算?应用领域的巨大计算需求单CPU的计算能力有限应用对计算资源的需求3CopyrightbyLiXinliang●CFD的计算资源依赖性计算量大——流动的多尺度性(湍流)大飞机全部流动细节完全分辨:最小尺度:mm~mm量级;计算网格:1012-1016;需计算量:~1020-30;工程需求:8个小时之内完成计算预计:LES:2045年;DNS:2080年最大

3、尺度~mmm几种我们常见的并行计算机CPUCPUCPU…总线或交叉开关Memory(a)SMP,物理上单一地址空间CPUCPUCPU…定制网络LMLMLM虚拟分布共享存储(DSM)(b)DSM,逻辑上单一地址空间P/CP/CP/C…定制/标准网络LMLMLM(c)Cluster/COW,物理/逻辑上多地址空间SMPMPPMPP…WANLMDSMSM(d)Grid(ClusterofClusters)并行计算机体系结构5CopyrightbyLiXinliang内存带宽瓶颈访存冲突机制控制复杂虚拟共享存储“NUMA”访存冲突机制控制复杂克服了访存冲突及

4、内存瓶颈访存的局部性——对网络要求不严各系统的性能210021002100210021002100210021002100单处理器共享存储局域并行机群广域并行机群G F L O P S6CopyrightbyLiXinliang低价格可扩展自行搭建的简易机群7CopyrightbyLiXinliang并行机群:搭建简单——简单的局域网并行机群=局域网早期作者搭建的简易机群机群软件:Linux/Windows;套件OSCAR;MPICH.NT,……我国最早搭建的机群:LSEC张林波搭建的32节点机CopyrightbyLiXinliang8美洲虎/17

5、00万亿次曙光5000A/160万亿次天河1号千万亿次CPU+GPU混合系统联想深腾7000/106万亿次单精度千万亿次的GPU系统Mole-xx顶级的超级计算机目标:每秒1摩尔次浮点运算(1mole=6.02*1023)CopyrightbyLiXinliang91NationalSupercomputingCenterinTianjin ChinaTianhe-1A-NUDTTHMPP,X56702.93Ghz6C,NVIDIAGPU,FT-10008C/2010 NUDT1863682566.004701.004040.002DOE/SC/Oa

6、kRidgeNationalLaboratory UnitedStatesJaguar-CrayXT5-HEOpteron6-core2.6GHz/2009 CrayInc.2241621759.002331.006950.603NationalSupercomputingCentreinShenzhen(NSCS) ChinaNebulae-DawningTC3600Blade,IntelX5650,NVidiaTeslaC2050GPU/2010 Dawning1206401271.002984.302580.004GSICCenter,Toky

7、oInstituteofTechnology JapanTSUBAME2.0-HPProLiantSL390sG7Xeon6CX5670,NvidiaGPU,Linux/Windows/2010 NEC/HP732781192.002287.631398.615DOE/SC/LBNL/NERSC UnitedStatesHopper-CrayXE612-core2.1GHz/2010 CrayInc.1534081054.001288.632910.00排名SiteComputer计算机描述cores核心数实测速度/峰值速度(Tflops);耗电量(

8、KW)Top5超级计算机(2010-11)2.并行程序设计工具1)共享存储式自动并行(并行编译器)Intel

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。