欢迎来到天天文库
浏览记录
ID:50243773
大小:1.29 MB
页数:18页
时间:2020-03-07
《计算机组成原理_-CPU子系统-CPU高级技术介绍.ppt》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、3.6CPU高级技术介绍(流水/超线程/多核)1/183.6.1流水技术2/18把指令过程分解为若干子过程,每个子过程都可有效地在其专用功能段上与其它子过程重叠执行,这种技术称为流水技术。3TI1I1假设有3条指令:I1、I2、I3I1I2I3I1I2I3FT/DT/ETI1FTDTETI11T1T1TI2t=0t=1Tt=2Tt=3T3T中:流水完成了I1+I2/I3部分操作非流水与流水方式对比:3/18[例]浮点加法的四段式流水线(时空图)求阶差对阶尾数相加规格化进入离开TTTTI1I2I3I
2、4I5I6I1I2I3I4I5I6I1I2I3I4I6I1I2I3I4I5I6求阶差对阶尾数相加规格化0t1t2t3t4t5t6t7t8t9执行6条指令:I1~I6串行执行6条指令:24T流水执行6条指令:9T每条指令:4TI5※流水线的特点流水线的子过程称为流水线的“级”或“段”,子过程的数目称为流水线的“流水深度”(m)。每个子过程由专用的功能段实现,各功能段的时间应基本相等,通常为1个时钟周期(1拍)。流水线需要经过一定的通过时间才能稳定流水技术适合于大量相同指令的执行。4/18(即无空闲功
3、能段):t稳=T×m把功能部件(如浮点加)细分成若干子功能段(求阶差、对阶、尾数加、规格化)。多条指令中该操作的不同子操作可在这些子功能段上流水执行。1.流水线的基本类型(1)按流水线的处理层级→操作部件级流水→指令级流水→处理机级流水把一条指令的执行分成若干个过程(如FT/DT/ET),多条指令的不同过程可以流水执行。把复杂任务细分成若干子任务(指令组)。多个任务的不同子任务可以在不同处理器上流水执行。5/18(2)按流水线能完成的功能数量①单功能流水线②多功能流水线多功能流水线按同一时间内可连
4、接完成的功能数量不同,又分为:→静态多功能流水线→动态多功能能流水线(控制太复杂,很少使用)两者的时-空关系图如后所示6/18(同一时刻只能连接成1种固定功能)(同一时刻只能连接成多种不同功能)7/18t0t1t2I3I4I3I4I3I4功能2t0t1t2I3I4I3I4I3I4功能2I1I2I1I2I1I2I1I2功能1I1I2I1I2I1I2I1I2功能1静态多功能流水线动态多功能流水线(4)按流水线内各段的连接模式→线性流水线(前馈型)→非线性流水线(存在反馈连接)(5)按流水线输入输出对应
5、关系→顺序流水线(先进先出)→乱序流水线(无序、错序或异步)(3)按处理的数据形态→标量流水线→向量流水线8/18S1S2S3S1S2S32.流水线的性能指标→吞吐率单位时间内处理的任务数或数据量→加速比同一程序,不采用流水的执行时间与采用流水的执行时间的比值。→利用率流水线中各部件的平均利用率,即一定时间内,部件实际工作时间与部件总时间的比值。9/1824T/9T(4T×6)/(4T×9)3.超标量流水线和超流水线※标量与超标量流水线标量流水线:在每个时钟周期只发射1条指令,并要求每个时钟周期只
6、从流水线流出一条指令的结果。超标量流水线:是指在每个时钟周期向流水线发射多条指令,并能从流水线流出多个结果。10/1811/181TI1I2I3I4I5I6I1I2I3I7I8I9I4I5I62T3T时钟周期发射的指令三发射超标量流水线示意图I10I11I12I7I8I9※超流水线技术超流水线:把完成一条指令的流水线的各一级子过程进一步细分成若干二级子过程12/18时钟周期发射指令取指译码执行写回1T2T假设指令的4个子过程:(=超流水的度、深度)超流水的度=3※超标量超流水线处理技术同时使用超流
7、水线和超标量技术。超标量的度=3,超流水的度=3,超标量超流水的度=3×3=9。13/18时钟周期发射指令取指译码执行写回1T2T3T指令的4个子过程:每个时钟周期发射3次、每次发射3条,共9条指令。3.6.2SMT与超线程SMT(SimultaneousMultithreading)即同步多线程。Intel在2002年开发的HT(Hyper-threading),即超线程技术就是一种典型的SMT,首先运用于Xeon(至强)处理器。从而率先实现了在一颗CPU上同时硬件级地并行执行多个程序的指令。[
8、例如]Intel的第4代corei714/18(Haswell,4核8线程)。使CPU能够执行分别来自多个线程的指令(一种硬件多线程技术)。3.6.3多核技术多核处理器也称为片上多处理器,主要特征是在一个处理器芯片上集成多个CPU内核。1996年,斯坦福大学提出,但技术未发展起来。1、多核的发展原因通过提高单核CPU主频、IPS的手段已无潜力;2、多核的种类原生多核,各内核独立,如AMDAthlon64X2(速龙)封装多核,各内核共享前端总线不完全独立;15/18双核处理器(Du
此文档下载收益归作者所有