欢迎来到天天文库
浏览记录
ID:56963343
大小:251.50 KB
页数:43页
时间:2020-07-22
《计算机系统结构 流水线技术 3.5 向量处理机课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、3.5向量处理机3.5.1向量处理方式和向量处理机◆向量处理机:具有向量数据表示和相应向量指令的流水线处理机。◆标量处理机:不具有向量数据表示和相应向量指令的处理机。D=A×(B+C)A、B、C、D──长度为N的向量1.向量处理方式第三章流水线技术工艺规程的内容(1)水平(横向)处理方式Ki=bi+ciDi=Ki×ai相关:N次功能切换:2N次工艺规程的内容(2)垂直(纵向)处理方式K=B+CD=K×A相关:1次功能切换:1次对处理机结构的要求:存储器-存储器型操作的运算流水线对存储器的带宽要求很高。例如:STAR-100,CYBER-2053.5向量
2、处理机工艺规程的内容3.5向量处理机(3)分组(纵横)处理方式把向量分成长度为某个固定值的若干组,组内按纵向方式处理,依次处理各组。每组内:相关:1次功能切换:2次3.5向量处理机工艺规程的内容3.5向量处理机工艺规程的内容对处理机结构的要求:寄存器-寄存器型操作的运算流水线。举例工艺规程的内容2.向量处理机的速度评价方法◆标量处理机:通常用每秒执行多少指令MIPS(MillionInstructionsPerSecond)来衡量机器的运算速度。◆向量处理机:常用每秒取得多少个浮点运算结果表示机器速度,以MFLOPS(MillionofFloa
3、tingPointPerSecond)作为测量单位。另一种评定计算机速度的方法:比较法。(选择一台速度指标得到公认的机器作为标准机,给定一些典型的基准程序。)3.5向量处理机工艺规程的内容3.5.2提高向量处理机性能的主要技术1.CRAY-I简介◆美国CRAY公司◆1976年◆每秒亿次浮点运算◆主频:80MHz字长:64位2.CRAY-1的基本结构◆向量运算部件:6个整数加,逻辑运算,移位浮点加,浮点乘,求倒数3.5向量处理机工艺规程的内容◆向量寄存器组:8×64V0~V7◆每个Vi每个向量运算部件◆向量长度寄存器VL◆向量屏蔽寄存器VMCRAY-1向
4、量处理的显著特点:只要不出现Vi冲突和向量功能部件冲突,各个Vi之间和各个向量功能部件之间都能并行工作,大大加快了向量指令的处理。3.5向量处理机工艺规程的内容3.CRAY-1向量指令类型◆Vk←ViopVj◆Vk←SiopVj◆Vk←主存◆主存←ViVi冲突:指的是并行工作的各向量指令的源向量或结果向量的Vi有相同的。向量功能部件冲突:指同一个向量功能部件被一条以上的并行工作向量指令所使用。3.5向量处理机工艺规程的内容3.5向量处理机工艺规程的内容4.链接技术当两条指令出现“写后读”相关时,若它们不存在功能部件冲突和向量寄存器(源或目的
5、)冲突,就有可能把它们所用的功能部件头尾相接,形成一个链接流水线,进行流水处理。链接特性实质上是把流水线“定向”的思想引入到向量执行过程的结果。3.5向量处理机工艺规程的内容工艺规程的内容例3.7对上述向量运算D=A*(B+C),若向量长度N≤64,向量元素为浮点数,则在B、C取到V0、V1后,就可用以下三条向量指令求解:(1)V3←存储器(访存,载入A)(2)V2←V0+V1(浮点加)(3)V4←V2*V3(浮点乘,存D)解:链接过程如图3.44所示:3.5向量处理机◆三条向量指令全部用串行方法执行,则总的执行时间为:[(1+6+1)+N
6、-1]+[(1+6+1)+N-1]+[(1+7+1)+N-1]=3N+22拍3.5向量处理机◆前两条向量指令并行执行之后,再执行第三条向量指令,则总的执行时间为:[(1+6+1)+N-1]+[(1+7+1)+N-1]=2N+15拍◆采用向量链接技术,所需拍数(亦称为链接流水线的流水时间)为:[(1+6+1)]+[(1+7+1)]=17拍则三条向量指令总执行时间为:[(1+6+1)]+[(1+7+1)]+(N-1)=N+16拍3.5向量处理机5.向量链接的一些主要要求:(除了要保证无向量寄存器使用冲突和无向量功能部件使用冲突的条件之外)◆在进行
7、链接的时候,只有在前一条向量指令的第一个结果元素送入结果向量寄存器的那一个时钟周期才可以进行链接,若错过该时刻就不能进行链接。◆只有当前一条向量指令全部执行完毕,释放相应的向量寄存器资源后才能执行后面的向量指令。3.5向量处理机◆当一条向量指令的两个源操作数分别是两条先行向量指令的结果寄存器时,要求先行的两条向量指令产生运算结果的时间必须相等,即要求有关向量功能部件的延迟时间相等。◆只有所有可以链接执行的向量指令的向量长度相等时,它们之间才能链接执行,否则它们之间也不能链接执行。3.5向量处理机6.向量循环或分段开采技术如果向量的长
8、度大于向量寄存器的长度,该如何处理呢?◆向量循环:长向量循环分段处理的程序结构。把长向量分成固
此文档下载收益归作者所有