《并行处理机》PPT课件.ppt

《并行处理机》PPT课件.ppt

ID:52277653

大小:213.51 KB

页数:27页

时间:2020-04-03

《并行处理机》PPT课件.ppt_第1页
《并行处理机》PPT课件.ppt_第2页
《并行处理机》PPT课件.ppt_第3页
《并行处理机》PPT课件.ppt_第4页
《并行处理机》PPT课件.ppt_第5页
资源描述:

《《并行处理机》PPT课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第8章并行处理机8.1并行处理(SIMD)机原理8.2并行处理机算法8.3并行处理机举例并行处理机是通过重复设置大量相同的处理单元PE(ProcessingElement),将它们按一定的方式互连,在统一的控制部件CU(ControlUnit)控制下,对各自分配来的不同数据并行地完成同一条指令所规定的操作。它依靠操作一级的并行处理来提高系统的速度。并行处理机的控制部件中进行的是单指令流,因此与高性能单处理机一样,指令基本上是串行执行,最多加上使用指令重叠或流水线的方式工作。指令重叠是将指令分成两类,把只适合串行处理的控制和标量类指令留给控制部件自己执行,而把适合于并

2、行处理的向量类指令播送到所有处理单元,控制让处于活跃的那些处理单元去并行执行。因此这是一种标量控制类指令和向量类指令的重叠执行。8.1.1并行处理机的原理和基本构成并行处理机分类并行处理机根据存贮器采用的组成方式不同分成两种基本构成。(1)分布存贮的并行处理机各个处理单元设有局部存贮器存放分布式数据,只能被本处理单元直接访问。此种局部存贮器称为处理单元存贮器(ProcessingElementMemory)PEM。在控制部件CU内设有一个用来存放程序的主存贮器CUM。整个系统在CU统一控制下运行系统程序的用户程序。执行主存中的用户程序指令播送给各个PE,控制PE并行

3、地执行。(2)共享存贮的并行处理机。每个PE没有局部存触器,存储模块以集中形式为所有PE共享。互连网IN受CU控制,具有双向性采用分布式存贮器组成基本结构。…ICNPE0PE1PEN-1MM0MM1MMN-1CUSCI/O-CHI/OSM……PEM0PE0PEM1PE1PEMN-1PEMN-1ICNCUCUMI/O接口DSC(A)具有共享存贮器并行处理机结构(B)分布存贮器并行处理机结构共享-分布存储器并行处理机的特点并行处理机的单指令流多数据流处理方式和由它产生的特殊结构是以诸如有限差分、矩阵、信号处理、线性规划等一系列计算问题为背景发展起来的。这些计算问题的共

4、同特点是可以通过各种途径把它们转化成为对数组或向量的处理,而并行处理机正好利用多个处理单元对向量或数组所包含的各个分量同时计算,从而获得很高的处理速度。并行VS流水,资源重复,Vs时间重叠;同时性,VS并发性;其设备利用率却可能没有多个单功能流水线部件那样高。只有在硬件价格有了大幅度下降及系统结构有了较大改进的情况下,并行处理机才能具有较好的性能价格比。第8章并行处理机8.1并行处理(SIMD)机原理8.2并行处理机算法8.3并行处理机举例处理单元阵列由64个PUi构成,每个Pui包括(PEi和PEMi)由64个结构完全相同的处理单元PEi构成,每个处理单元PEi字

5、长64位,PEMi为隶属于PEi的局部存储器,每个存储器有2K字,全部PEi由CU统一管理,PEi都有一根方式位线,用来向CU传送每个PEi的方式寄存器D中的方式位,使CU能了解各PEi的状态是否活动,作为控制它们工作的依据。阵列控制器CU相当一台小型控制计算机对处理单元阵列实现控制,(发控制信号,广播公共地址,广播公共数据)对指令流进行译码控制,利用CU内部资源可以进行标量操作,接受和处理各类中断,其他输入输出操作。I/O系统由磁盘文件系统DFS,输入输出子系统和宿主计算机S/C构成(驻留操作系统,编译程序,I/O服务程序等)8.2.1并行处理机的算法8.2.1并

6、行处理机的算法ILLIACⅣ的处理单元阵列结构图8.2ILLIACⅣ处理单元的互连结构PU16PU0PU8PU7PU55PU63PU0PU1PU7PU8PU9PU15PU56PU57PU63PU0PU1PU7PU56PU57PU58在阵列处理机上,解决矩阵加法是最简单的一维情形。若有两个8×8的矩阵A、B相加,所得结果矩阵C也是一个8×8的矩阵。只需把A、B居于相应位置的分量存放在同一个PEM内,且在全部64个PEM中,令A的分量均为同一地址α,B的分量单元均为同一地址α+1,而结果矩阵C的各个结果分量也相应存放于各PEM同一地址α+2的单元内,如图6.4所示。这样

7、,只需用下列3条ILLIACⅣ的汇编指令就可以一次实现矩阵相加:SIMD处理机的算法举例-矩阵加法LDAALPHA;全部(α)由PEMi送PEi的累加器RGAiADRNALPHA+1;全部(α+1)与(RGAi)进行浮点加,结果送RGAiSTAALPHA+2;全部(RGAi)由PEi送PEMi的α+2单元这里,0≤i≤63。SIMD处理机的算法举例-矩阵乘由于矩阵乘是二维数组运算,故它比循环加要复杂一些。设A、B和C为3个8×8的二维矩阵。若给定A和B,则为计算C=A*B的64个分量,可用下列公式其中,0≤i≤7且0≤j≤7。在SISD计算机上求解这个问题,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。