向量流水线计算机技术.ppt

向量流水线计算机技术.ppt

ID:48050224

大小:398.00 KB

页数:26页

时间:2020-01-12

向量流水线计算机技术.ppt_第1页
向量流水线计算机技术.ppt_第2页
向量流水线计算机技术.ppt_第3页
向量流水线计算机技术.ppt_第4页
向量流水线计算机技术.ppt_第5页
资源描述:

《向量流水线计算机技术.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、向量处理机结构目前已成为解决数值计算问题的一种最重要的高性能结构。向量处理机的性能价格比是很引人注目的,因为与相同价格的串行处理机相比,它们的向量运算吞吐量要高出1~2个数量级。但是,这种吞吐量提高只是对特定结构问题而言,也就是说,局限于那些可以转化为向量运算的问题。第六章向量流水线技术(P347)——前言本章任务了解向量处理机特点、一般结构,并掌握提高向量处理机性能方法。6.1特点多数为巨型机,绝大多数向量处理机都采用流水线结构。当一条流水线不能达到所要求性能时,设计者往往采用多条单功能流水线。第六章向量流水线技术----向量处理机的结构为实现向量化处理,向量处理机操作部件一般采用

2、流水线结构。下面是典型的向量加法器结构:向量处理机设计中要解决两个问题:(1)设法维持连续数据流(提供连续的A和B)。(2)设法降低对存储器压力。向量处理机一般采取以下技术措施:(1)用多独立存储器模块达到需要带宽。例STAR-100,32体。(2)增设高速中间存储器——向量寄存器。根据采用技术措施不同,向量处理机分为两种不同结构:(1)存储器——存储器结构(2)寄存器——寄存器结构第一节向量处理机的结构(1)存储器——存储器结构第一节向量处理机的结构主存储器由多个存储器模块构成。流水线运算器与主存储器系统间有三条相互独立的数据通路,各数据通路可同时工作。第一节向量处理机的结构假设一

3、个存储周期占两个处理机周期。下图是计算C=A+B最理想方法。第一节向量处理机的结构典型系统:CDC的STAR-100,1973年完成。主要技术参数:主频:40ns;字长:64位;主存容量:100万字,磁芯存储器,32体,存储周期为1.28微妙,每个体的数据宽度为8个字,STAR-100存储系统的频带宽度为:(32*8)/1.28微妙=2*字/秒使主存有较高带宽的另一种方法是由一级或多级中间存储器形成一个层次结构存储器系统,其中带宽最高的这级存储器安排在距处理器最近位置。即寄存器一寄存器结构。CRAY-1是世界上第一台向量流水处理巨型机。是美国Cray公司于1976年提供产品。运算速度

4、达亿次/秒以上巨型机。速度这么高的一个原因是它采用了层次结构的存储器系统。第一节向量处理机的结构(2)寄存器-寄存器结构简化的Cray-l的框图:主存与流水结构运算器间有一级或两级中间存储器。中间存储器与CACHE比特点:不透明;访问快;支持新数据结构(3)两种结构的简单比较:第一种结构是依靠主存来保证流水线所需的操作数。因此主存必须具有至少和运算器所要求带宽一样高的带宽。这就要求主存或者存取速度足够快,或者分为多个独立的存储模块,或者两者都具备,因为运算器要求的最大带宽非常高。第二种结构是通过容量比主存小得多的中间存储器即寄存器来保证很高的带宽。这样,低速存取主存就不会妨碍流水结构

5、运算器连续运行。第二种结构的另一好处是流水结构运算器可以重叠进行,因为高速寄存器带宽足以满足几个流水结构运算部件的带宽要求。第一节向量处理机的结构6.2典型工作方式CRAY-1是世界上第一台向量流水处理巨型机。(1)CRAY-1技术术语向量寄存器组V0,V1,……,V7。分量计数器链接方式(P370)启动、输出延迟(各1拍)。D=A*(B+C)向量长度<=64,B和C已取至V0和V1,V3←AV2←V0+V1V4←V2*V3第一、二条指令既无寄存器冲突,也无功能部件冲突,可并行执行。第三条与第一、二条指令均存在先写后读的相关冲突,可将第三条与第一、二条指令链接。由于同步的要求,数据进

6、入和流出每个功能部件,包括访存都需要1拍时间。(2)链接技术(369)前一条指令结果不必送回存储器直接作为后一条指令的操作数,甚至可在前一条指令完成之前就使用其结果。若采用链接技术,则执行时间为:(1+6+1)+(1+7+1)+(N-l)=N+16拍若这三条指令全部用串行方法,则执行时间为:[(1+6+1)+N-1]+[(1+6十1)+N-1]+[(1+7+1)+N-1]=3N+22拍若前两条指令并行执行,第三条指令串行执行,则执行时间为:[(1+6+1)+N-1]+[(1+7+l)+N-1]=2N+15拍假设向量长度为N,分析:实现链接除了无向量寄存器使用冲突和无功能部件使用冲突外

7、,还有时间上的要求,只有当前一条指令的第一个结果分量送入结果向量寄存器的那一个时钟周期方可链接,若错过该时刻就不能进行链接,只有当前一条向量指令全部执行完毕,释放向量寄存器资源后才能执行后面指令。另外,当一条向量指令的两个源操作数分别是两条先行指令的结果寄存器时,要求先行的两条指令产生运算结果的时间必须相等,即要求有关功能部件的延迟时间相等,此外还要求这两条向量指令的向量长度必须相等,否则也不能链接。功能部件冲突──指令运算符号相同;Vi变量冲突──指令中

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。