MPI并行程序设计初步

MPI并行程序设计初步

ID:38568514

大小:4.98 MB

页数:57页

时间:2019-06-15

MPI并行程序设计初步_第1页
MPI并行程序设计初步_第2页
MPI并行程序设计初步_第3页
MPI并行程序设计初步_第4页
MPI并行程序设计初步_第5页
资源描述:

《MPI并行程序设计初步》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、计算流体力学讲义第五讲MPI并行程序设计(1)李新亮lixl@imech.ac.cn;力学所主楼219;82543801知识点:MPI程序的运行机制——拷贝N份,给每个进程一份MPI的基本库函数——6个库函数“对等式”编程方法——站在单个进程的角度思考1讲义、课件上传至www.cfluid.com(流体中文网)->“流体论坛”->“CFD基础理论”CopyrightbyLiXinliangCopyrightbyLiXinliang2Part1:基本概念及MPI并行编程入门并行计算基本概念MPI并行编程入门1)MPI简介2)MPI的基本函数及消息传递3)MPI的常用函数4)对等式

2、编程思想的举例说明——全收集、矩阵相乘一、基本概念并行计算机简介大规模并行计算——超级计算(Supercomputing)/高性能计算(HPC)为何需要超级计算?应用领域的巨大计算需求单CPU的计算能力有限应用对计算资源的需求3CopyrightbyLiXinliang●CFD的计算资源依赖性计算量大——流动的多尺度性(湍流)大飞机全部流动细节完全分辨:最小尺度:mm~mm量级;计算网格:1012-1016;需计算量:~1020-30;工程需求:8个小时之内完成计算预计:LES:2045年;DNS:2080年最大尺度~mmm几种我们常见的并行计算机CPUCPUCPU…总线或交叉

3、开关Memory(a)SMP,物理上单一地址空间CPUCPUCPU…定制网络LMLMLM虚拟分布共享存储(DSM)(b)DSM,逻辑上单一地址空间P/CP/CP/C…定制/标准网络LMLMLM(c)Cluster/COW,物理/逻辑上多地址空间SMPMPPMPP…WANLMDSMSM(d)Grid(ClusterofClusters)并行计算机体系结构5CopyrightbyLiXinliang内存带宽瓶颈访存冲突机制控制复杂虚拟共享存储“NUMA”访存冲突机制控制复杂克服了访存冲突及内存瓶颈访存的局部性——对网络要求不严各系统的性能2100210021002100210021

4、00210021002100单处理器共享存储局域并行机群广域并行机群G F L O P S6CopyrightbyLiXinliang低价格可扩展自行搭建的简易机群7CopyrightbyLiXinliang并行机群:搭建简单——简单的局域网并行机群=局域网早期作者搭建的简易机群机群软件:Linux/Windows;套件OSCAR;MPICH.NT,……我国最早搭建的机群:LSEC张林波搭建的32节点机CopyrightbyLiXinliang8美洲虎/1700万亿次曙光5000A/160万亿次天河1号560万亿次CPU+GPU混合系统联想深腾7000/106万亿次单精度千万亿

5、次的GPU系统Mole-xx顶级的超级计算机目标:每秒1摩尔次浮点运算(1mole=6.02*1023)CopyrightbyLiXinliang9排名SiteComputer计算机描述cores核心数实测速度/峰值速度(Tflops);耗电量(KW)1OakRidgeNationalLaboratoryUnitedStatesJaguar-CrayXT5-HEOpteronSixCore2.6GHz/2009CrayInc.2241621759/2331;6950.62DOE/NNSA/LANLUnitedStatesRoadrunner-BladeCenterQS22/LS

6、21Cluster,PowerXCell8i3.2Ghz/OpteronDC1.8GHz,VoltaireInfiniband/2009;IBM1224001042/1375.78;2345.503NationalInstituteforComputationalSciences/UniversityofTennesseeUnitedStatesKrakenXT5-CrayXT5-HEOpteronSixCore2.6GHz/2009CrayInc.98928831.70/1028.85Top5超级计算机(2009-11)美洲虎半年间性能猛增69%的秘密在于处理器核心数量的暴涨

7、:在配备AMD刚刚发布的六核心“伊斯坦布尔”Opteron24352.6GHz(单颗浮点性能10.4GFlops)后,美洲虎的核心数从129600个增至224162个(+73%),且每核心搭配2GB内存,每个完整的计算节点由12个处理核心和16GB共享内存组成,整套系统300TB内存、10PB(10000TB)硬盘。CopyrightbyLiXinliang10排名SiteComputer计算机描述cores核心数实测速度/峰值速度(万亿次);耗电量(千瓦)4Forschungszentru

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。