欢迎来到天天文库
浏览记录
ID:27094655
大小:558.50 KB
页数:56页
时间:2018-12-01
《§3向量的流水处理与向量流水处理机》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、§3向量的流水处理与向量流水处理机将向量数据表示和流水线技术结合起来,构成向量流水处理机,简称向量处理机(VectorProcessor)向量的流水处理向量流水处理机向量的流水处理提高流水性能方法:增加流水线段数,以减少Δt每个时钟同时启动多条指令减少相关,减少功能变换次数,增加处理指令条数。向量的流水处理(续)向量操作特点向量元素间操作相互独立,且为相同操作相当于标量循环,对指令带宽的访问要求不高可采用多体交叉存储器,减少访存延迟。向量操作很适合于流水处理或并行处理。向量的流水处理(续)向量处理过程置VL、VM、A取向量到V运算
2、。向量的分量间采取的是流水方式。并行处理机(SIMD)处理向量时采取的是并行方式。向量的流水处理(续)向量处理工作方式如:D=A×(B+C)横向加工:bi+ci->k,k*ai->di产生N次相关,2N次功能切换,适合标量循环纵向加工:bi+ci->ki,ki*ai->di产生1次相关,1次功能切换,可流水处理纵横处理:对向量分组,组内纵向、组间横向处理向量流水处理机向量流水处理机的指令系统向量流水处理机的结构超级向量流水处理机举例向量流水处理机的指令系统包含有向量型和标量型两类指令向量型运算类指令向量V1运算得向量V2,如V2=
3、SIN(V1)向量V运算得标量S,如向量V1与向量V2运算得向量V3,V3=V1^V2向量V1与标量S运算得向量V2,V2=S*V1特殊操作指令向量比较指令向量压缩指令归并指令向量传送指令向量流水处理机的结构1972年首次交付使用CRAY-1向量流水处理机分布异构型多处理机系统,由中央处理机、诊断维护控制处理机、大容量磁盘存储子系统、前端处理机组成6个流水线单功能部件:整数加、逻辑运算、移位、浮点加、浮点乘和浮点迭代求倒数向量寄存器由512个64位寄存器组成,分成8组主存V0V7向量寄存器组(8×64个)加向量功能部件标量寄存器S
4、0S7加浮点功能部件VM向量控制移位逻辑运算相乘迭代求倒数向量控制向量长度寄存器VLBTR/W地址寄存器A超级向量流水处理机举例1972年成立CRAY公司,至今生产了400台以上的超级计算机1979年CRAY-1S,CRAY-1改进型,有10条流水线1983年CRAYX-MP,用4台CRAY-11985年CRAY-2S1988年CRAYY-MP,8台处理机1991年CRAYY-MPC-901996年12月,克雷研究公司也被SGI公司以7.5亿美元收购目前产品:MTA、SV1、SX_6、T3E2002年CrayX1。运算速度最高为每
5、秒52万亿次,支持65.5TB存储器。宣布了在2010年以前实现能够连续地处理每秒1000万亿次网址:www.cray.com超级向量流水处理机举例(续)CDC公司1973年推出第一台超级计算机STAR-1001964年CDC-6600RISC特征1982年CYBER205ETA10:8个CPU网址:几种超级计算机的向量性能和标量性能机器型号FujitsuVP400CrayISCray2SCrayX-MPCrayY-MPHitachiS820NECSX2向量性能Mflops标量性能Mflops向量平衡点85.09.80.90151
6、.511.20.93143.313.10.92201.617.00.92737.317.80.98424.29.50.98207.16.60.97向量平衡点(vectorbalancepoint)定义为:为了使向量硬件设备和标量硬件设备的利用率相等,一个程序中向量代码所占的百分比。§4指令级高度并行的超级计算机超标量处理机超长指令字处理机超流水线处理机超标量处理机采用多指令流水线(度=m)配置多套功能部件、指令译码电路和多组总线,并且寄存器也备有多个端口和多组总线。适合于求解稀疏向量、矩阵IBMRS/6000、DEC21064、I
7、nteli960CA、TandemCyclone(飓风)等超标量处理机(续)取指译码执行存结果部件时间度m=3的超标量处理机时空图超标量处理机基本结构一般流水线处理机:一条指令流水线一个多功能操作部件,每个时钟周期平均执行指令的条数小于1。多操作部件处理机:一条指令流水线多个独立的操作部件,操作部件可以采用流水线,也可以不流水多操作部件处理机的指令级并行度小于1超标量处理机典型结构:多条指令流水线进的超标量处理机有:定点处理部件CPU,浮点处理部件FPU,图形加速部件GPU大量的通用寄存器,两个一级高速Cache超标量处理机的指令
8、级并行度大于1举例:Motorola公司的MC8811010个操作部件两个寄存器堆:整数部件通用寄存器堆,32个32位寄存器;浮点部件扩展寄存器堆,32个80位寄存器。每个寄存器堆有8个端口,分别与8条内部总线相连接,有一个缓冲深度为4的先行读数栈
此文档下载收益归作者所有