资源描述:
《计算机系统结构 第6章 向量处理机ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、6.1向量数据表示方式6.2向量处理机的结构6.3向量处理方式6.4向量处理机的关键技术6.5向量处理机实例6.6向量处理机的性能评价6.7向量处理机的发展第6章向量处理机7/29/20211计算机系统结构第六章向量处理机具有向量数据表示和向量指令系统的处理机向量处理机是解决数值计算问题的一种高性能计算机向量处理机属大型或巨型机,也可以用微机加一台向量协处理器组成向量处理机一般都采用流水线结构,通常有有多条并行工作的流水线必须把要解决的问题转化为向量运算,才能发挥向量处理机的效率7/29/20212计算机系统结构第六章向量处理机
2、6.1向量数据表示方式6.1.1从标量到向量6.1.2等间距向量表示法6.1.3带位移量的向量表示法6.1.4稀疏向量表示法7/29/20213计算机系统结构第六章向量处理机例6.1:一个简单的C语言程序如下:for(i=10;i<=1010;i++)c[i]=a[i]+b[i+5];在向量处理机上,可以只用一条指令:C(10:1010)=A(10:1010)+B(15:1015)一条向量指令可处理N个或N对操作数在标量处理机上用10多条指令,其中有8条指令要循环1000次。采用多寄存器结构的两地址指令编写程序存储器采用字节编
3、址方式,字长为32位6.1.1从标量到向量7/29/20214计算机系统结构第六章向量处理机在一般标量处理机中需要如下指令序列来实现(A、B、C分别是向量a、b、c在内存中的起始地址):START:LOADR0,ST;读循环初值10LOADR1,ED;读循环终值1010LOADR2,L;读内存地址增量4MOVER3,R2MULR3,R0;计算向量偏移量,;初始值为40LOOP:LOADR4,A(R3);读A向量的一个元素7/29/20215计算机系统结构第六章向量处理机LOADR5,B(R3);读B向量的一个元素ADDR4,R5
4、;加一个元素STORER4,C(R3);写C向量的一个元素ADDR3,R2;改变向量偏移量INCR0;循环次数增1CMPR0,R1;循环是否结束BLELOOP;循环未结束转LOOP,;否则继续HALT;停机ST:10;循环初值ED:1010;循环终值L:4;内存地址增量7/29/20216计算机系统结构第六章向量处理机三个参数表示一个等间距向量:向量起始地址:A向量长度:L向量间距:f6.1.2等间距向量表示法7/29/20217计算机系统结构第六章向量处理机例如:我国研制的银河向量机,有8个向量寄存器V0~V7,每个向量寄存器
5、由64个64位的寄存器组成,存储器字长64位,采用字节编址方式,则连续向量的间距为f=8。向量指令采用三地址形式:例如:ViVjOPVk,向量长度(VL)=50,则实际完成的运算是:V3,00~V3,49与V5,00~V5,49分别相加,结果放在V1,00~V1,49中。7/29/20218计算机系统结构第六章向量处理机6.1.3带位移量的向量表示法用三个参数表示一个向量:向量基地址:A向量长度:L向量位移量:f向量有效长度:L-f向量起始地址:A+f优点:每个向量可以带有位移,能够通过控制向量实现可变增量。能够表示稀疏向量。
6、7/29/20219计算机系统结构第六章向量处理机带位移量的向量表示法7/29/202110计算机系统结构第六章向量处理机7/29/202111计算机系统结构第六章向量处理机7/29/202112计算机系统结构第六章向量处理机6.1.4稀疏向量表示法定义:0元素很多,非0元素很少的向量称为稀疏向量采用压缩方法存储稀疏向量可以节省存储空间。可以还原之后进行运算,也可以用压缩方法直接进行运算7/29/202113计算机系统结构第六章向量处理机7/29/202114计算机系统结构第六章向量处理机6.2向量处理机的结构主要采用两种方法:
7、存储器-存储器结构多个独立的存储器模块并行工作处理机结构简单对存储系统的访问速度要求很高寄存器-寄存器结构运算通过向量寄存器进行需要大量高速寄存器对存储系统访问速度的要求降低7/29/202115计算机系统结构第六章向量处理机1.存储器-存储器结构向量处理机中有多个高速流水线运算部件,存储器的访问速度是关键采用多个存储体交叉和并行访问来提高存储器速度例如:CRAY-1有64个存储体,每个处理机访问4个存储体STAR-100采用32个存储体交叉,每个存储体并行读出8个64位数据我国研制的YH-1向量计算机有37个存储体7/
8、29/202116计算机系统结构第六章向量处理机操作数缓冲栈和写结果缓冲栈主要用于解决访问存储器冲突。虽然采用质数个存储体能消除访问存储器的冲突,但是,数据经过多次运算之后,在存储体中分布必然发生改变主要优缺点:硬件结构简单,造价低;速度相对较低操作数缓冲栈写结