欢迎来到天天文库
浏览记录
ID:38548880
大小:4.98 MB
页数:56页
时间:2019-06-14
《CFD2011-第13讲-MPI并行程序设计初步》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、计算流体力学讲义2011第13讲MPI并行程序设计(1)李新亮lixl@imech.ac.cn;力学所主楼219;82543801知识点:MPI程序的运行机制——拷贝N份,给每个进程一份MPI的基本库函数——6个库函数“对等式”编程方法——站在单个进程的角度思考1讲义、课件上传至www.cfluid.com(流体中文网)->“流体论坛”->“CFD基础理论”CopyrightbyLiXinliangCopyrightbyLiXinliang2Part1:基本概念及MPI并行编程入门并行计算基本概念MPI并行编程入门1)MPI简介2)MPI的基本函数及
2、消息传递3)MPI的常用函数4)对等式编程思想的举例说明——全收集、矩阵相乘一、基本概念并行计算机简介大规模并行计算——超级计算(Supercomputing)/高性能计算(HPC)为何需要超级计算?应用领域的巨大计算需求单CPU的计算能力有限应用对计算资源的需求3CopyrightbyLiXinliang●CFD的计算资源依赖性计算量大——流动的多尺度性(湍流)大飞机全部流动细节完全分辨:最小尺度:mm~mm量级;计算网格:1012-1016;需计算量:~1020-30;工程需求:8个小时之内完成计算预计:LES:2045年;DNS:2080年最大
3、尺度~mmm几种我们常见的并行计算机CPUCPUCPU…总线或交叉开关Memory(a)SMP,物理上单一地址空间CPUCPUCPU…定制网络LMLMLM虚拟分布共享存储(DSM)(b)DSM,逻辑上单一地址空间P/CP/CP/C…定制/标准网络LMLMLM(c)Cluster/COW,物理/逻辑上多地址空间SMPMPPMPP…WANLMDSMSM(d)Grid(ClusterofClusters)并行计算机体系结构5CopyrightbyLiXinliang内存带宽瓶颈访存冲突机制控制复杂虚拟共享存储“NUMA”访存冲突机制控制复杂克服了访存冲突及
4、内存瓶颈访存的局部性——对网络要求不严各系统的性能210021002100210021002100210021002100单处理器共享存储局域并行机群广域并行机群GFLOPS6CopyrightbyLiXinliang低价格可扩展自行搭建的简易机群7CopyrightbyLiXinliang并行机群:搭建简单——简单的局域网并行机群=局域网早期作者搭建的简易机群机群软件:Linux/Windows;套件OSCAR;MPICH.NT,……我国最早搭建的机群:LSEC张林波搭建的32节点机CopyrightbyLiXinliang8美洲虎/17
5、00万亿次曙光5000A/160万亿次天河1号千万亿次CPU+GPU混合系统联想深腾7000/106万亿次单精度千万亿次的GPU系统Mole-xx顶级的超级计算机目标:每秒1摩尔次浮点运算(1mole=6.02*1023)CopyrightbyLiXinliang91NationalSupercomputingCenterinTianjinChinaTianhe-1A-NUDTTHMPP,X56702.93Ghz6C,NVIDIAGPU,FT-10008C/2010NUDT1863682566.004701.004040.002DOE/SC/Oa
6、kRidgeNationalLaboratoryUnitedStatesJaguar-CrayXT5-HEOpteron6-core2.6GHz/2009CrayInc.2241621759.002331.006950.603NationalSupercomputingCentreinShenzhen(NSCS)ChinaNebulae-DawningTC3600Blade,IntelX5650,NVidiaTeslaC2050GPU/2010Dawning1206401271.002984.302580.004GSICCenter,Toky
7、oInstituteofTechnologyJapanTSUBAME2.0-HPProLiantSL390sG7Xeon6CX5670,NvidiaGPU,Linux/Windows/2010NEC/HP732781192.002287.631398.615DOE/SC/LBNL/NERSCUnitedStatesHopper-CrayXE612-core2.1GHz/2010CrayInc.1534081054.001288.632910.00排名SiteComputer计算机描述cores核心数实测速度/峰值速度(Tflops);耗电量(
8、KW)Top5超级计算机(2010-11)2.并行程序设计工具1)共享存储式自动并行(并行编译器)Intel
此文档下载收益归作者所有