高等计算机体系结构第5章.ppt

高等计算机体系结构第5章.ppt

ID:56425387

大小:178.00 KB

页数:29页

时间:2020-06-18

高等计算机体系结构第5章.ppt_第1页
高等计算机体系结构第5章.ppt_第2页
高等计算机体系结构第5章.ppt_第3页
高等计算机体系结构第5章.ppt_第4页
高等计算机体系结构第5章.ppt_第5页
资源描述:

《高等计算机体系结构第5章.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第五章工作负载驱动的性能评价1第一节性能指标和测量一、基本性能指标1、机器参数结点参数:CPU速度、主频、存储系统(主存大小、页大小、Cache大小、块大小、关联度等)等;通信系统参数:互连网络参数(占用度、网络距离、带宽)、启动延迟、传送粒度、通信模型;系统参数:结点数。2、程序参数问题规模、工作负载、负载不平衡开销、通信/计算、并行度、数据访问模式、工作集尺寸、通信开销、并行开销、同步开销等。23、系统性能指标系统性能靠程序反映,分绝对性能和性能可扩展性两部分。执行时间处理速度Pn=w/Tn吞吐率:单位时间内处理作业的数量利用

2、率Un=Pn/[n(t0(n)+αwtc(n))]性能/价格:处理速度与购买价格的比可扩展性:性能随问题规模、处理器数、机器参数的加速比趋势。对程序而言还有下列性能:顺序执行时间、并行执行时间、加速比、效率。影响因素:程序参数、机器参数,以及他们之间的相互作用产生的影响。3二、如何评价系统性能性能评价目的:评价实际机器性能、推断设计是否合理(如机器特性对系统性能的影响)、探索可能的折中方案。1、评价性能方法模拟:通过软件方法对系统进行评价。内容:编写模拟器、选择工作负载、模拟结果分析与评价。测量:通过实际测量方法对系统进行评价。内

3、容:选择工作负载及参数,在固定和变化PE数的情况下运行程序,测量性能。42、评价性能内容用测试程序进行测试,测试程序可为实际程序。系统绝对性能:机器的分离性能--执行不同的微测试程序;机器的总体性能—执行不同的宏测试程序。并行性产生的性能改善:机器的可扩展性—在可改变机器参数及工作负载时,执行相同程序,分析机器特性对系统性能的影响。系统比较:性能相对性—在不同的机器上,执行算法最优的相同程序。53、基准测试程序类型名称测量范围微基准程序LINPACK数值计算(线性代数)LMBENCHUnix中的系统调用和数据移动STREAM存储器

4、带宽宏基准程序NAS并行计算(CFD)PARKBENCH并行计算SPEC混合基准测试程序Splash并行计算STAP信号处理TPC商业应用注意:基准测试程序只是全部测试程序的一部分;基准测试程序不能有效反映可扩展性。64、对测试程序要求测试程序应能够覆盖整个应用领域,即选择多个有代表性的问题进行编程;测试程序应保证工作负载呈现足够的并发性和负载平衡,以真实地反映系统的性能;测试程序的算法、数据结构、数据的规划和分布、通信和同步的协调应最优化,负载应平衡,使编程不影响系统性能;测试程序的问题规模应能够覆盖系统结构的各方面,以实现公正

5、的评价,和对系统分离性能的评价。7第二节可扩展性和加速比分析一、考虑扩展性的原因1、问题规模的不确定性问题规模:指特定问题的输入配置,通常用参数向量表示。应与机器规模相适应,才能准确反映并行性带来的性能。问题规模太大:单处理机上不能运行,无法测量性能;系统呈超线性加速,性能失真。问题规模太小:多处理机通信开销失衡,性能失真。用户需求变化:应能根据机器参数特性改变配置,取得良好性能。82、机器规模的可变化性机器规模:是刻画结点的处理性能、存储结构等的向量。问题规模只有与处理器数量和机器规模相匹配,才能取得最佳性能。增加机器规模:解决

6、更大问题或更快解决相同问题。机器规模与问题规模的匹配:不同问题规模的特性对机器规模的要求不同,如存储结构。3、可扩展研究研究问题规模、处理器数量、机器规模三者关系,及在不同需求时的最佳扩展方法。9二、扩展模型与加速比的测量可扩展性分类:面向用户扩展、面向资源扩展。面向资源扩展:固定负载扩展(PC)、固定时间扩展(TC)、固定存储器扩展(MC)。1、Amdahl定律:固定负载目的:使高频部分更快,解决顺序瓶颈。设:工作负载W=αW+(1-α)W,n个PE的固定负载加速比:当n→∞时Amdahl定律含义:对给定工作负载,最大加速比为1

7、/α;为获得好的加速比,应使顺序瓶颈α尽可能小;应设法使较大(使用频率高)部分执行得更快。10W1WnW1WnW1WnW1WnW1WnW1Wnn工作负载123456(a)固定负载T1TnT1TnT1TnT1TnT1TnT1Tnn执行时间(b)减少执行时间123456α加速比Sn1024×0%1%2%3%4%91×48×31×24ש固定负载的加速比结论:顺序瓶颈无法单纯用增加处理器数量来解决。引入开销后的固定负载加速比:当n→∞时注意:程序性能受限于顺序瓶颈和平均开销。112、Gustafson定律:固定时间目的:提高并行性,缓解

8、顺序瓶颈。设:扩大后的工作负载W’=αW+(1-α)nW,n个PE的固定时间加速比:Gustafson定律含义:若扩展工作负载以维持固定时间,则固定时间加速比是n的线性函数;工作负载扩展到与可扩展计算能力相匹配时,顺序部分便不再成为瓶颈。Gusta

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。