体系结构与并行基础

体系结构与并行基础

ID:38564398

大小:1.54 MB

页数:27页

时间:2019-06-15

体系结构与并行基础_第1页
体系结构与并行基础_第2页
体系结构与并行基础_第3页
体系结构与并行基础_第4页
体系结构与并行基础_第5页
资源描述:

《体系结构与并行基础》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、体系结构与并行基础赵永华中科院计算机网络信息中心超级计算中心yhzhao@sccas.cn*2并行机体系结构并行计算机系统结构分类*3Flynn分类:(instruction/datastream)SISD(单指令单数据),SIMD(单指令多数据),MIMD,MISD结构模型分类:PVP(并行向量机),SMP(共享内存),MPP(大规模并行计算机),DSM(分布共享内存),COW(集群)访存模型分类:UMA(UniformMemory-access,均匀存储访问模型)NUMA(non-UMA)COMA(Cache-OnlyMemoryArchitecture,全高速

2、缓存内存体系结构)CC-NUMA(Cache-Coherent0一致性高速缓存非均匀存储访问模型),NORMA(No-RomateMemoryAccess非远程存储访问模型)结构模型共享内存/对称多处理机系统(SMP)PVP:并行向量机单地址空间共享存储UMA(UniformMemoryAccess)SMP:共享内存并行机(SharedMemoryProcessors)。多个处理器通过交叉开关(Crossbar)或总线与共享内存互连。任意处理器可直接访问任意内存地址,且访问延迟、带宽、几率都是等价的;系统是对称的;单地址空间、共享存储、UMA;并行编程方式:通常采用

3、OpenMP,也可使用消息传递(MPI/PVM)及HPF。SGIPowerChallenge,Dawning1*5MPP:大规模并行计算机系统MPP:大规模并行计算机系统(MassivelyParallelProcessors)。由大量具有局部内存的计算结点通过高速系统网络联接而构成的并行处理系统.MPP系统的系统网络通常具有某种拓扑结构(如tree,mesh,torus,hypercube).物理和逻辑上均是分布内存采用高通信带宽和低延迟的互联网络(专门设计和定制的)NORMA或CC-NUMA代表:CRAYT3E(2048),ASCIRed(3072),IBMSP

4、2,曙光1000*6DSM:分布共享存储多处理机系统DSM:分布共享存贮并行机(DistributedSharedMemory),由结点(一般是SMP系统)通过高速消息传递网络互连而成。存贮系统在物理上分布、逻辑上共享。各结点有自己独立的寻址空间。单地址空间、分布共享NUMA(NonuniformMemoryAccess)与SMP的主要区别:DSM在物理上有分布在各个节点的局部内存从而形成一个共享的存储器;代表:SGIOrigin2000,CrayT3D*7Cluster:机群系统Cluster(Now,Cow):群集系统。将单个节点,用商业网络:Ethernet,

5、Myrinet,Quadrics,Infiniband,Switch等连结起来形成群集系统。每个节点都是一个完整的计算机(SMP或DSM),有自己磁盘和操作系统各个节点通过高性能网络相互连接网络接口和I/O总线松耦合连接每个节点有完整的操作系统多地址空间、分布非共享、NORMA通用性、可扩展性好,性价比高*8访存模型*9UMANORMANUMA:多处理机(单地址空间共享存储器)UMA:UniformMemoryAccessNUMA:NonuniformMemoryAccess多计算机(多地址空间非共享存储器)NORMA:No-RemoteMemoryAccess最新

6、的TOP500计算机*10*11最新的TOP500计算机来自Cray的美洲豹“Jaguar”,凭借1.75PFlop/s(每秒1750万亿次)的计算能力傲视群雄。“Jaguar”采用了224162个处理器核心来自中国的曙光“星云”系统以1271万亿次/s的峰值速度名列第二采用了自主设计的HPP体系结构、高效异构协同计算技术处理器是32nm工艺的六核至强X5650,并且采用了NvidiaTeslaC2050GPU做协处理的用户编程环境;异构体系结构专用通用TOP500中85%的系统采用了四核处理器,而有5%的系统已经使用了六核或者更多核的处理器。*12并行编程基础*1

7、3并行计算软件环境操作系统:UNIX、LINUX等通信库:MPI、PVM数学库:如MKL,ScaLAPACK等编译器:GNUCompiler自由软件,持C/C++、Fortran77等语言高性能计算中常用的:C/C++:GCC(GNUC/C++Compiler)Fortran:gfortran;IntelCompiler由Intel公司针对Intel处理器开发,支持Linux、Windows支持C/C++(icc,mpicc:IntelC/C++Compiler)、Fortran77/90/95(ifc:IntelFortranCompiler)支持多线程和Op

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。