欢迎来到天天文库
浏览记录
ID:59473043
大小:386.00 KB
页数:85页
时间:2020-09-14
《向量处理机ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第六章向量处理机6.1向量处理的基本概念6.2向量处理机的结构6.3提高向量处理机性能的方法6.4向量处理机实例6.5向量处理机的性能评价向量由一组有序、具有相同类型和位数的元素组成,特别适合流水处理。在有些流水线处理机中,为了充分发挥流水线处理机的效率,实现高性能计算,设置了向量数据表示和相应的向量指令,称为向量处理机。不具有向量数据表示和相应的向量指令的流水线处理机,称为标量处理机。典型的向量处理机1976年Cray-1超级计算机,浮点运算速度达到了每秒1亿次CDCCyber205,CrayY-MP,NECSX-X/44,FujitsuVP260
2、0等,性能达到了每秒几十亿~几百亿次浮点运算6.1向量的处理方式以计算表达式D=A×(B-C)为例A、B、C、D──长度为N的向量6.1向量的处理方式横向(水平)处理方式向量计算是按行的方式从左到右横向地进行。先计算:d1←a1×(b1-c1)再计算:d2←a2×(b2-c2)……最后计算:dN←aN×(bN-cN)组成循环程序进行处理。qi←bi-cidi←qi×ai数据相关:N次功能切换:2N次不适合于向量处理机的并行处理。6.1向量的处理方式纵向(垂直)处理方式向量计算是按列的方式从上到下纵向地进行。q1←b1-c1d1←q1×a1先计算……再
3、计算……qN←bN-cNdN←qN×aN表示成向量指令:Q=B-CD=Q×A两条向量指令之间:数据相关:1次功能切换:1次6.1向量的处理方式纵横(分组)处理方式又称为分组处理方式。把向量分成若干组,组内按纵向方式处理,依次处理各组。对于上述的例子,设:N=S×n+r其中N为向量长度,S为组数,n为每组的长度,r为余数。若余下的r个数也作为一组处理,则共有S+1组。运算过程为:6.1向量的处理方式先算第1组:Q1~n←B1~n-C1~nD1~n←Q1~n×A1~n再算第2组:Q(n+1)~2n←B(n+1)~2n-C(n+1)~2nD(n+1)~2n
4、←Q(n+1)~2n×A(n+1)~2n依次进行下去,直到最后一组:第S+1组。每组内各用两条向量指令。数据相关:1次功能切换:2次向量处理机的结构因具体机器不同而不同。由所采用的向量处理方式决定。有两种典型的结构存储器-存储器型结构纵向处理方式采用寄存器-寄存器型结构分组处理方式采用6.2向量处理机的结构6.2向量处理机的结构6.2.1“存储器-存储器”结构在纵向处理方式中,向量长度N的大小不受限制,无论N有多大,相同的运算都用一条向量指令完成。此时,向量指令的源向量和目的向量都是存放在存储器中,运算的中间结果需要送回存储器(不是向量寄存器)。此时
5、流水线运算部件的输入和输出端都直接(或经过缓冲器)与存储器相联。这就是“存储器-存储器”型结构。6.2向量处理机的结构6.2.1“存储器-存储器”结构-适用于对向量长度不受限制的纵向处理方式采用纵向处理方式的向量处理机对处理机结构的要求:存储器-存储器结构向量指令的源向量和目的向量都是存放在存储器中,运算的中间结果需要送回存储器。流水线运算部件的输入和输出端都直接(或经过缓冲器)与存储器相联,从而构成存储器-存储器型操作的运算流水线。例如:STAR-100、CYBER-2056.2向量处理机的结构“存储器-存储器”型操作的运算流水线ABC=A+B6.
6、2向量处理机的结构要充分发挥这种结构的流水线效率,存储器要不断地提供源操作数,并不断地从运算部件接收结果。(每拍从存储器读取两个数据,并向存储器写回一个结果)对存储器的带宽以及存储器与处理部件的通信带宽提出了非常高的要求。解决方法:一般是通过采用多体交叉并行存储器和缓冲器技术。例如,70年代初问世的Star100存储器:32个体交叉每个体的数据宽度:8个字(字长64位)最大数据流量:每秒2亿字6.2向量处理机的结构“存储器-存储器”型操作的运算流水线6.2向量处理机的结构向量的分组处理方式中,向量被分为每n个数据一组,以组为单位进行数据的分组和运算。
7、此时对向量长度N没有限制,但是组的长度n是固定的。这样就可以设置能快速访问的向量寄存器来存放源向量、目的向量和中间结果。此时流水线的运算部件的输入、输出端都与向量寄存器相连。6.2.2“寄存器-寄存器”结构-适用于纵横处理方式6.2向量处理机的结构以CRAY-1机为例美国CRAY公司1976年每秒1亿次浮点运算时钟周期:12.5nsCRAY-1的基本结构功能部件共有12条可并行工作的单功能流水线,可分别流水地进行地址、向量、标量的各种运算。6.2向量处理机的结构为向量运算提供6个单功能流水部件:整数加(3拍)逻辑运算(2拍)移位(4拍)浮点加(6拍)
8、浮点乘(7拍)浮点迭代求倒数(14拍)括号中的数字为其流水经过的时间,每拍为一个时钟周期,即12.5ns。任
此文档下载收益归作者所有