8计算机系统结构(第八讲).ppt

8计算机系统结构(第八讲).ppt

ID:48851136

大小:4.99 MB

页数:55页

时间:2020-01-31

8计算机系统结构(第八讲).ppt_第1页
8计算机系统结构(第八讲).ppt_第2页
8计算机系统结构(第八讲).ppt_第3页
8计算机系统结构(第八讲).ppt_第4页
8计算机系统结构(第八讲).ppt_第5页
资源描述:

《8计算机系统结构(第八讲).ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、计算机系统结构(第八讲)厦门大学计算机科学系陆达2004年12月13日第五章标量处理机5.3.2超流水线处理机什么是超流水线处理机?这种在一个基本时钟周期内能够分时发射多条指令的处理机称为超流水线处理机超流水线处理机:流水线的级数≥8超标量处理机:是以增加硬件资源为代价来换取处理机的性能;空间并行性超流水线处理机:只需增加少量硬件,是通过各部分硬件的充分重叠工作来提高处理机的性能;时间并行性5.3.2.1指令执行时序在一个时钟周期内能够发射n条指令,每隔1/n个时钟周期发射一条指令图5.79:超流水线处理机的指令执行时空图(每

2、个时钟周期分时发射2条指令)功能段可以进一步细分:“译码(ID)功能段”=“译码”流水级+“取第一个操作数”流水级+“取第二个操作数”流水级5.3.2.2典型处理机结构CRAY-1、CDC-7600:n=3SGI公司的MIPS(microprocessorwithoutinterlockedpipedstages):R2000、R3000、R4000、R5000、R10000图5.80:MIPSR4000超流水线处理机结构两个Cache:指令Cache、数据Cache整数部件:通用寄存器堆、ALU、装入对准器/存入驱动器、整数

3、乘法/除法部件浮点部件:浮点通用寄存器堆、浮点乘法部件、浮点除法部件、浮点加法/转换/求平方根部件、浮点控制器、浮点流水线专用通路图5.81:MIPSR4000处理机的流水线操作8级流水线、每个时钟周期包含两个流水线图5.82:MIPSR4000正常指令流水线工作时序一个时钟周期内,流水线执行完成了两条指令图5.83:LOAD指令引起的流水线暂停暂停一个时钟周期(两个流水线周期)5.3.2.3超流水线处理机性能在一台指令级并行度为(1,n)的超流水线处理机上,执行N条没有数据相关和控制相关的指令所需要的时间为:T(1,n)=[

4、k+(N-1)/n]*△tn:每个时钟周期分时发射的指令的条数N:需要执行的指令条数k:指令流水线的功能段数k*n:指令流水线的级数加速比:S(1,n)=T(1,1)/T(1,n)=n*(k+N-1)/(n*k+N-1)S(1,n)max=n5.3.3超标量超流水线处理机超标量处理机:在一个时钟周期内发射多条指令;主要开发空间并行性,依靠多个操作在重复设置的操作部件上同时执行来提高程序的执行速度超流水线处理机:把一个时钟周期细分为多个流水线周期,每一个时钟周期能够发射并执行完成多条指令;主要开发时间并行性,在同一操作部件上重叠

5、多个操作,通过使用较快时钟周期的深度流水线来加快程序的执行速度超标量超流水线处理机:超标量处理机+超流水线处理机5.3.3.1指令执行时序图5.84:超标量超流水线处理机的指令执行时空图在一个时钟周期内要发射指令n次,每次发射指令m条,每个时钟周期共要发射指令m*n条5.3.3.2典型处理机结构DEC公司的Alpha21064处理机结构(图5.85)四个部件:(1)、整数执行部件(EBOX)(2)、浮点执行部件(FBOX)(3)、地址部件(ABOX)(4)、中央控制部件(IBOX)两个Cache:(1)、指令Cache(2)、

6、数据Cache采用顺序发射乱序完成的方式控制指令流水线图5.86:Alpha21064处理机的指令流水线结构三条指令流水线:(1)、整数操作流水线(7级)(2)、访问存储器流水线(7级)(3)、浮点操作流水线(10级)每个指令流水线的前四个流水级(IF、SWAP、I0、I1)采用静态流水线每个指令流水线的后3~6个流水级采用动态流水线Alpha21064处理机:每个时钟周期能够发射两条指令;三条指令流水线的平均级数为8级;属于超标量超流水线处理机5.3.3.3超标量超流水线处理机性能在一台指令级并行度为(m,n)的超标量超流水

7、线处理机上,连续执行N条没有资源冲突,没有数据相关和控制相关的指令所需要的时间为:T(m,n)=[k+(N-m)/(m*n)]*△tm:每个时钟周期同时发射指令的条数n:每个时钟周期分时发射的指令的条数k:指令流水线的时钟周期N:需要连续执行的指令的条数加速比:S(m,n)=T(1,1)/T(m,n)=[m*n*(k+N-1)]/[m*n*k+N-m]S(m,n)max=m*n图5.87:三种指令级并行处理机的相对性能横坐标:处理机的设计指令级并行度(m*n)纵坐标:处理机能够达到的实际指令级并行度结论:(1)、超标量处理机相

8、对性能最高,其次是超标量超流水线处理机,超流水线处理机的相对性能最低;(2)、一般认为m和n都不要超过4;(3)、一个特定程序由于受到本身的数据相关和控制相关的限制,它的指令级并行度的最大值是确定的,这个最大值主要由程序自身的语义来决定,与这个程序运行在那一种处理机上无关。本

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。