并行机体的结构 - 性能评测

并行机体的结构 - 性能评测

ID:26654906

大小:2.22 MB

页数:46页

时间:2018-11-28

并行机体的结构 - 性能评测_第1页
并行机体的结构 - 性能评测_第2页
并行机体的结构 - 性能评测_第3页
并行机体的结构 - 性能评测_第4页
并行机体的结构 - 性能评测_第5页
资源描述:

《并行机体的结构 - 性能评测》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第二章性能评测2.1引言2.1.1什么是并行机的基本性能2.1.2为什么要研究并行机的性能评测2.1.3如何评测并行机的性能2.2机器级性能评测2.2.1CPU和存储器的某些基本性能指标2.2.2并行和通信开销2.2.3并行机的可用性与好用性2.2.4机器的成本、价格与性/价比2.3算法级性能评测2.3.1加速比性能定律2.3.2可扩放性评测标准2.4程序级性能评测2.4.1基准测试程序的分类2.4.2基本基准测试程序2.4.3并行基准测试程序2.4.4商用基准测试程序2.4.5SPEC基准测试程序*2

2、.5如何提高性能2.5.1任务划分2.5.2通信分析2.5.3任务组合2.5.4处理器映射2.5.5任务调度2.6小结习题参考文献第二章性能评测本章首先简单介绍一下什么是并行计算机的基本性能?为什么要研究机器的性能评测以及如何评测计算机的性能?然后,分别讨论机器级的性能评测,包括CPU和存储器的某些基本性能指标,并行和通信开销以及机器的成本、价格与性/价比;算法级的性能评测,包括加速、效率和可扩放性等;程序级的性能评测,包括基本基准测试程序,并行基准测试程序,商用基准测试程序以及SPEC基准测试程序等;

3、最后,从任务划分、通信分析、任务组合和处理器映射等算法和程序设计的四个步骤,简要地讨论了如何提高并行系统的性能。2.1引言了解和使用并行机,自然要知道并行机的性能,就普通意义上讲,它就是并行机的好与不好。所以本节首先就从这些简单内容讲起,包括什么是并行机的基本性能,为什么需要评测机器的性能以及如何评测并行机性能。462.1.1什么是并行机的基本性能所谓机器的性能(Performance)通常是指机器的速度,它是程序执行时间的倒数。而程序执行时间是指用户向计算机送入一个任务后,直到获得他需要的结果这一段等

4、待时间,包括访问磁盘和访问存储器的时间,CPU运算时间,I/O动作时间以及操作系统的开销时间等。但在多任务系统中,CPU在等待I/O操作的同时可以转去处理另一个任务,这样分析起来就比较麻烦。所以在讨论性能时,有时也使用CPU时间,它表示CPU的工作时间,不包括I/O等待时间和运行其它任务的时间。很显然,用户所看到的执行时间是程序结束时所花费的全部时间,而不单是CPU时间。1.单CPU性能假定机器的时钟周期为TC,程序中指令总条数为IN,执行每条指令所需的平均时钟周期数为CPI,则一个程序在CPU上运行的

5、时间TCPU为:TCPU=IN×CPI×TC(2.1)其中,(2.2)Page:2Page:2上式中n为程序中所有指令种类数。令Ii/In表示第i种指令在程序中所占的比例,则上式可改写为:CPI=(2.3)2.MIPS和MFLOPS已如上述,执行时间的倒数就是速度。速度通常可用MIPS(MillionInstructionsPerSecond)表示,即每秒百万条指令,它很适合于评测标量机。对于一个给定的程序,MIPS可表示为:MIPS=IN/(TE×106)=RC/(CPI×106)=IN/(IN×CP

6、I×TC×106)(2.4)其中,TE表示程序执行时间,RC表示时钟速率,它是TC的倒数。有时还用相对MIPSRel这一标准,此时需要事先选择一个参照的计算机性能,然后与其比较:MIPSRel=(TRef/TV)×MIPSRef(2.5)其中,TRef表示在参照机上程序的执行时间,Tv表示相同程序在要评价机器上的执行时间,MIPSRef表示所约定的参照机的MIPS。在80年代,常以DEC公司的VAX-11/780作为参照机,称为1MIPS机器。MFLOPS(MillionFloatingPointOpe

7、rationsPerSecond)常用来评价向量计算机的性能,表示每秒百万次浮点运算:MFLOPS=IFN/(TE×106)(2.6)其中,IFN表示程序中的浮点运算次数。通常MFLOPS与MIPS46之间无统一标准的量值关系。一般认为在标量计算机中执行一次浮点运算平均需要3条指令,故有1MFLOPS约为3MIPS之说。3.并行机的基本性能指标并行计算机的基本性能参数可概括于表2.1中。表2.1并行机基本性能参数一览表名称符号含意单位机器规模n处理器的数目无量纲时钟速率f时钟周期长度的倒数MHZ工作负载

8、W计算操作的数目Mflop顺序执行时间T1程序在单处理机上的运行时间s(秒)并行执行时间Tn程序在并行机上的运行时间s(秒)速度Rn=W/Tn每秒百万次浮点运算Mflop/s加速Sn=T1/Tn衡量并行机有多快无量纲效率En=Sn/n衡量处理器的利用率无量纲峰值速度Rpeak=nR’peak所有处理器峰值速度之积,R’peak为一个处理器的峰值速度Mflop/s利用率U=Rn/Rpeak可达速度与峰值速度之比无量纲通信延迟to传送0-字节或

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。