欢迎来到天天文库
浏览记录
ID:38568514
大小:4.98 MB
页数:57页
时间:2019-06-15
《MPI并行程序设计初步》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、计算流体力学讲义第五讲MPI并行程序设计(1)李新亮lixl@imech.ac.cn;力学所主楼219;82543801知识点:MPI程序的运行机制——拷贝N份,给每个进程一份MPI的基本库函数——6个库函数“对等式”编程方法——站在单个进程的角度思考1讲义、课件上传至www.cfluid.com(流体中文网)->“流体论坛”->“CFD基础理论”CopyrightbyLiXinliangCopyrightbyLiXinliang2Part1:基本概念及MPI并行编程入门并行计算基本概念MPI并行编程入门1)MPI简介2)MPI的基本函数及消息传递3)MPI的常用函数4)对等式
2、编程思想的举例说明——全收集、矩阵相乘一、基本概念并行计算机简介大规模并行计算——超级计算(Supercomputing)/高性能计算(HPC)为何需要超级计算?应用领域的巨大计算需求单CPU的计算能力有限应用对计算资源的需求3CopyrightbyLiXinliang●CFD的计算资源依赖性计算量大——流动的多尺度性(湍流)大飞机全部流动细节完全分辨:最小尺度:mm~mm量级;计算网格:1012-1016;需计算量:~1020-30;工程需求:8个小时之内完成计算预计:LES:2045年;DNS:2080年最大尺度~mmm几种我们常见的并行计算机CPUCPUCPU…总线或交叉
3、开关Memory(a)SMP,物理上单一地址空间CPUCPUCPU…定制网络LMLMLM虚拟分布共享存储(DSM)(b)DSM,逻辑上单一地址空间P/CP/CP/C…定制/标准网络LMLMLM(c)Cluster/COW,物理/逻辑上多地址空间SMPMPPMPP…WANLMDSMSM(d)Grid(ClusterofClusters)并行计算机体系结构5CopyrightbyLiXinliang内存带宽瓶颈访存冲突机制控制复杂虚拟共享存储“NUMA”访存冲突机制控制复杂克服了访存冲突及内存瓶颈访存的局部性——对网络要求不严各系统的性能2100210021002100210021
4、00210021002100单处理器共享存储局域并行机群广域并行机群GFLOPS6CopyrightbyLiXinliang低价格可扩展自行搭建的简易机群7CopyrightbyLiXinliang并行机群:搭建简单——简单的局域网并行机群=局域网早期作者搭建的简易机群机群软件:Linux/Windows;套件OSCAR;MPICH.NT,……我国最早搭建的机群:LSEC张林波搭建的32节点机CopyrightbyLiXinliang8美洲虎/1700万亿次曙光5000A/160万亿次天河1号560万亿次CPU+GPU混合系统联想深腾7000/106万亿次单精度千万亿
5、次的GPU系统Mole-xx顶级的超级计算机目标:每秒1摩尔次浮点运算(1mole=6.02*1023)CopyrightbyLiXinliang9排名SiteComputer计算机描述cores核心数实测速度/峰值速度(Tflops);耗电量(KW)1OakRidgeNationalLaboratoryUnitedStatesJaguar-CrayXT5-HEOpteronSixCore2.6GHz/2009CrayInc.2241621759/2331;6950.62DOE/NNSA/LANLUnitedStatesRoadrunner-BladeCenterQS22/LS
6、21Cluster,PowerXCell8i3.2Ghz/OpteronDC1.8GHz,VoltaireInfiniband/2009;IBM1224001042/1375.78;2345.503NationalInstituteforComputationalSciences/UniversityofTennesseeUnitedStatesKrakenXT5-CrayXT5-HEOpteronSixCore2.6GHz/2009CrayInc.98928831.70/1028.85Top5超级计算机(2009-11)美洲虎半年间性能猛增69%的秘密在于处理器核心数量的暴涨
7、:在配备AMD刚刚发布的六核心“伊斯坦布尔”Opteron24352.6GHz(单颗浮点性能10.4GFlops)后,美洲虎的核心数从129600个增至224162个(+73%),且每核心搭配2GB内存,每个完整的计算节点由12个处理核心和16GB共享内存组成,整套系统300TB内存、10PB(10000TB)硬盘。CopyrightbyLiXinliang10排名SiteComputer计算机描述cores核心数实测速度/峰值速度(万亿次);耗电量(千瓦)4Forschungszentru
此文档下载收益归作者所有