北大高体高等计算机体系结构-课件-lect4

北大高体高等计算机体系结构-课件-lect4

ID:33589804

大小:1.64 MB

页数:80页

时间:2019-02-27

北大高体高等计算机体系结构-课件-lect4_第1页
北大高体高等计算机体系结构-课件-lect4_第2页
北大高体高等计算机体系结构-课件-lect4_第3页
北大高体高等计算机体系结构-课件-lect4_第4页
北大高体高等计算机体系结构-课件-lect4_第5页
资源描述:

《北大高体高等计算机体系结构-课件-lect4》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、高等计算机体系结构(AdvancedComputerArchitecture)第四讲第四讲计算机性能评测计算机性能评测((PPerformanceEvaluationerformanceEvaluation))李险峰(lixianfeng@pkusz.edu.cn)北京大学深圳研究生院性能(性能(performanceperformance))哪一个性能更高?2响应时间响应时间vsvs吞吐率吞吐率�响应时间(responsetime)−任务完成的时间,又称为执行时间(executiontime),延迟(latency)�吞吐率(throughput)−单位时间内完成

2、的任务数量,有些情况下又叫带宽(bandwidth)如果我们为一个计算机系统1.升级到更快的处理器2.增加处理器数量对系统响应时间和吞吐率分别有何影响?3性能定义(性能定义(PerformancePerformance))�在我们讨论单个处理器性能的时候,我们通常关心的是其执行时间(在涉及I/O设备或多处理器系统时,我们更关心吞吐率)�因此,对一个计算机设计X,此处其性能定义为:Performance(X)=1/Executiontime(X)�X比Y快n倍,意味着:Performance(X)/Performance(Y)=nX的执行时间是Y的1/n4执行时间执行

3、时间�总耗时(ElapsedTime,Wall-clockTime)−从程序开始执行到结束的总时间(包括内存和磁盘访问时间,等待I/O时间,OS开销、以及切换到其它程序执行的时间)−反映了用户的直接和最终体验�CPU时间(CPUTime)−CPU耗费在该程序执行上的时间(不包括等待I/O和其它程序执行的时间)−可进一步分为用户CPU时间(userCPUtime)和系统CPU时间(systemCPUtime,主要是OS系统调用)CPU时间=用户CPU时间+系统CPU时间总耗时=用户CPU时间+系统CPU时间+等待时间5执行时间的评估与比较执行时间的评估与比较�根据目标

4、对象的不同,我们会关注不同的执行时间部分−对应用程序设计者,往往关注用户CPU时间−对CPU设计者,往往关注应用程序整体CPU时间−对操作系统或整个计算机系统设计者,往往关注总耗时�有些时候,我们可能只关心两个计算机系统或应用程序的相对性能,如何比较?−以用户CPU时间为例,如何比较两个应用程序?6时钟周期数(时钟周期数(ClockCyclesClockCycles))�我们常常以时钟周期数、而不是以秒为单位来统计执行时间,因为现代计算机都是以时钟为驱动的同步电路,任何事件或操作,都是经若干时钟周期完成的。只要知道了程序执行的时钟周期数,很容易换算为真实执行时间se

5、condscyclesseconds=×programprogramcycle�时钟节拍(clockticks):对应一个时钟信号的起始和结束cycletimeticktick�时钟周期(cycletime)=timebetweenticks=secondspercycle�时钟频率(clockrate/frequency)=cyclespersecond(1Hz=1cycle/sec,1MHz=106cycles/sec19�例:A200Mhz.clockhasacycletime×10=5nanoseconds6200×107性能公式(性能公式(II))seco

6、ndscyclesseconds=×programprogramcycle等价于CPUexecutiontimeCPUclockcycles=×Clockcycletimeforaprogramforaprogram因此,为提高性能,我们可以采取的方法可以包括:−减少程序执行的时钟周期数,−降低时钟周期(提高时钟频率)8一个程序执行多少时钟周期?一个程序执行多少时钟周期?�是否可以假设#ofcycles=#ofinstructions?...1stinstr2ndinstr3rdinstr4th5th6th�但这个假设通常是不正确的!−不同的指令执行周期数不一样9一

7、个程序执行多少时钟周期?一个程序执行多少时钟周期?�乘法指令比加法需要更多的时钟周期�浮点运算比对应的整点计算需要更多时钟周期�访问内存数据比访问寄存器需要更多时钟周期�更复杂的情况。。。�改变处理器时钟周期?通常执行指令的时钟周期数也会发生变化,因为这意味着要改变硬件设计。10例子例子�一个程序P在computerA上执行需要10秒�通过设计优化得到的computerB,使程序P的执行时间缩短到6秒�设计者可以采用新技术来设计computerB,大大提升时钟频率,但该技术需要对CPU某些部分的设计进行更改,造成程序P在computerB上的执行的时钟周期数是在

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。