第6章-计算机系统结构(第五版)李学干

第6章-计算机系统结构(第五版)李学干

ID:65492880

大小:1.97 MB

页数:93页

时间:2022-01-09

第6章-计算机系统结构(第五版)李学干_第1页
第6章-计算机系统结构(第五版)李学干_第2页
第6章-计算机系统结构(第五版)李学干_第3页
第6章-计算机系统结构(第五版)李学干_第4页
第6章-计算机系统结构(第五版)李学干_第5页
第6章-计算机系统结构(第五版)李学干_第6页
第6章-计算机系统结构(第五版)李学干_第7页
第6章-计算机系统结构(第五版)李学干_第8页
第6章-计算机系统结构(第五版)李学干_第9页
第6章-计算机系统结构(第五版)李学干_第10页
资源描述:

《第6章-计算机系统结构(第五版)李学干》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、6.1向量的流水处理和向量流水处理机6.2阵列处理机的原理6.3SIMD计算机的互连网络6.4共享主存构形的阵列处理机中并行存储器的无冲突访问6.5脉动阵列流水处理机6.6本章小结6.1向量的流水处理和向量流水处理机6.1.1向量的处理和向量的流水处理虽然向量运算比标量运算更易发挥出流水线的效能,但处理方式选择不当也不行。【例6-1】计算D=A×(B+C),其中A、B、C、D都是有N个元素的向量,应该采用什么方式处理才能充分发挥流水线的效能如果采用逐个求D向量元素的方法,即访存取ai、bi、ci元素求di,再取ai+1、bi+1、ci+1求di+1,则这种处理

2、方式称为横向(水平)处理方式。6.1.2向量流水处理机的结构举例向量流水处理机的结构因具体机器的不同而不同。 图6-1只画出了CRAY-1中央处理机中有关向量流水处理部分的简图。图6-1CRAY-1的向量流水处理部分简图CRAY-1有标量类和向量类指令共128条,其中有4种向量指令如图6-2所示。   第Ⅰ种源向量分别取自两个向量寄存器组Vj、Vk,结果送向量寄存器组Vi。第Ⅱ种与第Ⅰ种的差别只在于它的一个操作数取自标量寄存器Sj。图6-2CRAY-1的四种向量指令6.1.3通过并行、链接提高性能一般可采取让多个流水线功能部件并行、流水线链接、加快条件语句和稀疏

3、矩阵处理、加快向量的归约操作等办法来提高向量流水处理的性能。以CRAY-1的向量流水为例,向量寄存器组Vi在同一时钟周期内可接收一个结果分量并为下次操作再提供一个源分量。每个Vi组都有单独的总线连到各功能部件上,而每个 功能部件也都有把运算结果送回向量寄存器组的输出总线。所谓Vi冲突,指的是并行工作的各向量指令的源向量或结果向量使用了相同的Vi。所谓功能部件冲突,指的是同一个功能部件被要求并行工作的多条向量指令所使用。第一、二条指令无任何冲突,可以并行执行。第三条指令与第一、二条指令出现Vi冲突,存在先写后读数相关,本来是不能并行执行的,但若能把第一、二条指令的结

4、果分量直接链接进第三条指令所用的功能部件,那第三条指令就能与第一、二条指令在大部分时间内并行。它们的链接过程如图6-3所示。图6-3通过链接技术实现向量指令之间大部分时间并行6.1.4提高向量流水处理速度的其他办法1.条件语言和稀疏矩阵的加速处理当程序中出现条件语句或进行稀疏向量、矩阵运算时,难以发挥出向量处理的优点。2.向量递归操作的加速处理CRAY-1的向量指令还可以通过让源向量和结果向量使用同一个向量寄存器组,并控制分量计数器值的修改,来实现递归操作。图6-4画出了其部分时间关系示意图。设源/结果向量寄存器组用V0,另一源向量寄存器组用V1。在指令开始执

5、 行前,先把V0的零分量(V00)置“0”。V1置入需要运算的全部浮点数分量。向量长度寄存器VL的内容假定置为64。图6-4递归向量和的部分时间关系运算结束后,V0中各个分量的内容如下:(V056)=(V048)+(V156)=(V10)+(V18)+(V116)+(V124)+(V132)+(V140)+(V148)+(V156)(V057)=(V049)+(V157)=(V11)+(V19)+(V117)+(V125)+(V133)+(V141)+(V149)+(V157)第八部分(结果部分)(V058)=(V050)+(V158) =(V12)

6、+(V110)+(V118)+(V126)+(V134) +(V142)+(V150)+(V158) (V059)=(V051)+(V159) =(V13)+(V111)+(V119)+(V127)+(V135) +(V143)+(V151)+(V159)第八部分(结果部分)(V060)=(V052)+(V160) =(V14)+(V112)+(V120)+(V128)+(V136) +(V144)+(V152)+(V160) (V061)=(V053)+(V161) =(V15)+(V113)+(V121)+(V129)+(V137) +(V14

7、5)+(V153)+(V161)第八部分(结果部分)(V062)=(V054)+(V162) =(V16)+(V114)+(V122)+(V130)+(V138) +(V146)+(V154)+(V162) (V063)=(V055)+(V163) =(V17)+(V115)+(V123)+(V131)+(V139) +(V147)+(V155)+(V163)第八部分(结果部分)6.2.1阵列处理机的构形和特点1.阵列处理机的构形阵列处理机有两种构形,两者的差别主要在于存储器的组成方式和互连网络的作用不同。构形1图6-5是具有分布式存储器的阵列

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。