《计算机系统结构》电子教案

《计算机系统结构》电子教案

ID:40771199

大小:252.61 KB

页数:32页

时间:2019-08-07

《计算机系统结构》电子教案_第1页
《计算机系统结构》电子教案_第2页
《计算机系统结构》电子教案_第3页
《计算机系统结构》电子教案_第4页
《计算机系统结构》电子教案_第5页
资源描述:

《《计算机系统结构》电子教案》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第5章指令级并行硬件方法(P111)(指令级,多发射或乱序执行,动态调度)本章学习由硬件(即流水线控制器)实现的指令级并行方法,主要内容是流水线的多指令控制技术,目的是让处理机中同时流动更多的指令,减少各种原因造成的停顿,以缩短程序执行时间。5.1指令级并行的概念(重点)5.2相关与指令级并行5.3指令的动态调度5.4动态分支预测技术(重点)5.5多指令流出技术(重点)2014.2.171计算机系统结构从执行程序的角度来看,并行性等级从低到高可分为:指令内部并行:单条指令中各微操作之间的并行。指令级并行:并行执行两条或两条以上的指令。线程级并行:并行执行两个或两个以上

2、的线程。通常是以一个进程内派生的多个线程为调度单位。任务级或过程级并行:并行执行两个或两个以上的过程或任务(程序段)。以子程序或进程为调度单元。作业或程序级并行:并行执行两个或两个以上的作业或程序。并行性等级的划分(P23,1.5.1节)2014.2.172计算机系统结构指令级并行的英文缩写是ILP(Instruction-LevelParallelism)开发ILP的途径有两种:资源重复,重复设置多个处理部件,让它们同时执行相邻或相近的多条指令;采用流水线技术,使指令重叠并行执行。(1)狭义指令级并行超标量SuperScalar(设备重复)超长指令字VeryLong

3、InstructionWord(简称VLIW)(2)广义指令级并行流水线Pipeline(设备细分)超级流水线SuperPipeline(3)线程级并行超线程Hyper-Threading(简称HT)(4)任务线程多核处理机Multicore5.1指令级并行的概念2014.2.173计算机系统结构静态调度(软件方法):在程序执行前,在编译过程中对目标指令序列进行优化,避免将来由于相关和冲突造成的停顿。主要手段是将冲突指令错开启动时间、变量换名等。动态调度(硬件方法):在程序执行中,由专门硬件预测将要发生的冲突、控制指令在流水线中的流动,避免停顿。2.流水线处理机的实际

4、CPI=理想流水线的CPI加上各类停顿的时钟周期数:CPI流水线=CPI理想+停顿结构冲突+停顿数据冲突+停顿控制冲突CPI理想是衡量流水线最高性能的一个指标。本式表明降低实际CPI有许多途径。换一个角度,有时从CPI的倒数看问题会有新思路,IPC(InstructionsPerCycle)是每个时钟周期完成的指令条数。在不能缩短单条指令周期数的情况下,在每个时钟周期里启动更多的指令(提高IPC),同样可以提高处理机的性能。这就是ILP的基本思想。1.开发ILP的方法分类2014.2.174计算机系统结构基本程序块:一串连续的代码除了入口和出口以外,没有其他的分支指令

5、和转入点。程序平均每4~7条指令就会有一个分支。4.循环级并行:使一个循环中的不同循环体并行执行。开发循环的不同叠代之间存在的并行性(最常见、最基本思路)这是指令级并行研究的重点之一5.最基本的开发循环级并行的技术循环展开(loopunrolling)技术采用向量指令和向量数据表示3.基本程序块2014.2.175计算机系统结构多发射技术(MultipleIssue):同时启动多条指令。为什么要多发射?在传统流水线上,要减少CPU时间,可以减少CPI或者Cycle。CPI的下限是1,减少Cycle碰到了“4G墙”(指Intel公司开发4GHzP4计划失败,因为功耗正比

6、于主频3次方),工程师们无奈又回头来打CPI的主意,想使CPI低于1,即在一个时钟周期内流出多条指令。狭义的多指令流出技术(同时启动)包括超标量(Superscalar)和超长指令字(VLIW),广义的多指令流出技术(分时启动)还包括超流水线(Superpipeline)等。超标量采用多条流水线的多发射技术,每个时钟周期流出的指令数不定,既可以使用编译器静态调度,也可以使用硬件动态调度。由于管理乱序流动中指令相关问题的硬件复杂度非常大,所以目前超标量CPU的ILP没有超过8的。采用单发射技术的传统处理机又被称为“标量处理机”。5.5多指令流出技术(又称多发射技术,P1

7、41)2014.2.176计算机系统结构超长指令字CPU采用长指令单发射,多个执行部件同时执行小指令的方法,每个时钟周期流出的小指令数是限定的。在编译过程中,由编译程序来判断实际指令之间的相关关系,进行静态调度,把抽取ILP的复杂工作转移给编译器,而执行指令的硬件则大大简化,也比较规则,有利于低功耗设计。超流水线则是将每个功能部件进一步流水化,使得一个功能部件在一拍中可以分时处理多条指令。5.5多指令流出技术(续)2014.2.177计算机系统结构5.5.0超标量技术:一个时钟节拍内同时发射多条指令(P142第1段)。时空图“超标量”的前身是“多操作

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。