资源描述:
《第12周大课 中央处理机(5).ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、1回顾把在同一CPU周期内并行执行的微操作控制信息,存储在控制存储器里,称为一条微指令(Microinstruction)。它是微命令的组合,微指令存储在控制器中的控制存储器中一条微指令通常至少包含两大部分信息:操作控制字段顺序控制字段,又称微地址码字段2回顾一条机器指令对应一个微程序,微程序由若干条微指令序列组成。从指令与微指令,程序与微程序,地址与微地址的一一对应关系来看,前者与内存储器有关,后者与控制存储器有关。3教学内容流水CPU4理解并行处理技术的三种类型;掌握流水CPU的工作机理,影响
2、流水线的效率的三个主要问题:资源相关、数据相关、控制相关。教学要求5流水CPU并行处理技术流水CPU的结构流水线中的主要问题6并行处理技术并行性概念问题中具有可以同时进行运算或操作的特性例:在相同时延的条件下,用n位运算器进行n位并行运算速度几乎是一位运算器进行n位串行运算的n倍(狭义)(广义)含义只要在同一时刻(同时性)或在同一时间间隔内(并发性)完成两种或两种以上性质相同或不同的工作,他们在时间上相互重叠,都体现了并行性7并行处理技术三种形式时间并行(重叠):让多个处理过程在时间上相互错开,轮
3、流使用同一套硬件设备的各个部件,以加快硬件周转而赢得速度,实现方式就是采用流水处理部件空间并行(资源重复):以数量取胜它能真正的体现同时性LSI和VLSI为其提供了技术保证时间+空间并行Pentium中采用了超标量流水线技术8流水CPU的结构流水计算机的系统组成存储器体系:主存采用多体交叉存储器;Cache流水方式CPU:指令部件、指令队列、执行部件指令流水线指令队列:FIFO执行部件:可以有多个采用流水线方式构成的算术逻辑部件构成,可以将定点运算部件和浮点运算部件分开。9流水CPU的结构流水线C
4、PU时空图IF(InstructionFetch取指)ID(InstructionDecode指令译码)EX(Execution执行)WB(WriteBack写回)10流水CPU的结构非流水CPU11流水CPU的结构流水CPU12流水CPU的结构13流水CPU的结构具有两条以上的指令流水线上图中流水线满载时,每一个时钟周期可以执行2条指令采用时间和空间并行技术14流水线中的主要问题资源相关数据相关控制相关15流水线中的主要问题资源相关(多条指令进入流水线后在同一时钟周期内争用同一功能部件)解决办法
5、:后边指令拖一拍再推进;增设一个功能部件16流水线中的主要问题数据相关(在一个程序中,后一条指令必须等待前一条指令执行完成后才能开始执行,我们称这两条指令数据相关)RAW(ReadAfterWrite)后面指令用到前面指令所写的数据WAW(WriteAfterWrite)两条指令写同一个单元在简单流水线中没有此类相关,因为不会乱序执行WAR(WriteAfterRead)后面指令覆盖前面指令所读的单元在简单流水线中没有此类相关解决办法:可以推后后继指令对相关单元的读操作设置相关的直接通路(Forw
6、arding)17流水线中的主要问题例:两条指令发生数据相关冲突RAW(ReadAfterWrite)ADDR1,R2,R3R2+R3-->R1SUBR4,R1,R5R1-R5-->R4ANDR6,R1,R7R1^R7-->R618解决办法例如:ADDR1,R2,R3;(R1)+(R2)->R3ADDR3,R4,R5;(R3)+(R4)->R5MULR6,R7,R3;(R6)*(R7)->R3MULR3,R8,R9;(R3)*(R8)->R9调整指令顺序,通过变量重命名来消除的数据相关调整指
7、令后ADDR1,R2,R3;MULR6,R7,R0;ADDR3,R4,R5;MULR0,R8,R9;调整指令后,速度可以提高一倍19流水线中的主要问题控制相关引起原因:转移指令解决办法:延迟转移法,转移预测法20【例4】流水线中有三类数据相关冲突:写后读(RAW)相关;读后写(WAR)相关;写后写(WAW)相关。判断以下三组指令各存在哪种类型的数据相关。(1)I1ADDR1,R2,R3;(R2)+(R3)->R1I2SUBR4,R1,R5;(R1)-(R5)->R4(2)I3STOM(x)
8、,R3;(R3)->M(x),M(x)是存储器单元I4ADDR3,R4,R5;(R4)+(R5)->R3(3)I5MULR3,R1,R2;(R1)×(R2)->R3I6ADDR3,R4,R5;(R4)+(R5)->R3流水线中的主要问题21解:第(1)组指令中,I1指令运算结果应先写入R1,然后在I2指令中读出R1内容。由于I2指令进入流水线,变成I2指令在I1指令写入R1前就读出R1内容,发生RAW相关。第(2)组指令中,I3指令应先读出R3内容并存入存储单元M(x),然后在I