并行程序的优化与性能评价

并行程序的优化与性能评价

ID:38170723

大小:318.05 KB

页数:4页

时间:2019-06-03

并行程序的优化与性能评价_第1页
并行程序的优化与性能评价_第2页
并行程序的优化与性能评价_第3页
并行程序的优化与性能评价_第4页
资源描述:

《并行程序的优化与性能评价》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、CN8121166öTP计算机工程与科学2000年第22卷第5期ISSN10072130XCOMPUTERENGINEERING&SCIENCEVol.22,No.5,2000文章编号:10072130X(2000)0520067204X并行程序的优化与性能评价OptimizationandPerformanceEvaluationofParallelPrograms刘杰迟利华胡庆丰LiuJie,ChiLihuaandHuQingfeng(国防科技大学计算机学院)(SchoolofComputerScience,NationalUniversity

2、ofDefenseTechnology)摘要:文中讨论了并行程序的优化问题,指出并行程序的优化应从数据划分、通信优化和串行程序优化三个方面着手。针对传统加速比的缺点和不足,我们提出了优化加速比模型来评价优化并行程序的性能;对NAS基准测试程序MG和FT进行了优化,用优化加速比模型分析了上述两个程序在IBMSP2上的性能。Abstract:Inthispaper,wediscusstheissueofoptimizingparallelprogramsandpointoutthatparallelprogramscanbeoptimizedbydat

3、amapping,reducingcommunicationandoptimizingsequentialprograms.Thetraditionalparallelcomputingperformancemetricisspeedup.Inthispaper,wefirstdiscussthedrawbacksofspeedupandthenintroduceanewoptimizedparallelcomputingperformancemetric(calledoptimized2speedup).Itprovidesafairperfor

4、mancemeasurement.WeoptimizetheNASparallelbenchmarksMGandFT.Usingoptimized2speedup,weanalyzetheparallelperformanceofMGandFTonIBMSP2.关键词:加速比;优化并行程序;性能评价模型;NAS基准测试程序集Keywords:speedup;optimizedparallelprogram;performancemetric;NASparallelbenchmarks中图分类号:TP311文献标识码:A充分开发出来。这些都需要我们根

5、据特定的并行1引言机结构对并行程序进行优化。对于优化并行程序进行性能评价通常都使用大型科学与工程问题要利用高性能的并行机加速比。加速比存在一个缺点,即当出现并行程来进行计算,并行程序设计的好坏直接影响并行序没有充分优化、Cache没被充分利用、编译优化机性能的发挥。通常并行程序只能发挥并行机峰低效等情况时并行处理的速度变慢,而加速比反[1]值性能的10%左右。很多并行程序的设计只考而增加,快的并行处理速度和好的加速比看起来虑通用性和可移植性,而没有充分考虑对于特定是矛盾的。这显然不能揭示并行计算的性能,因目标机结构的性能问题。还有很多并行程序是根此

6、需要有新的评价标准来对优化并行计算作出合据串行程序直接修改而成的,程序并行性还没有理的评价。X收稿日期:1999207219;修订日期:1999209218基金项目:“九五”国防预研基金和应用物理与计算数学研究所计算物理实验室预研基金资助项目。作者简介:刘杰(1969-),男,硕士,助理研究员,研究方向为并行算法与科学计算;迟利华,博士,助理研究员;胡庆丰,硕士,教授。通讯地址:410073湖南省长沙市国防科技大学计算机学院Address:SchoolofComputerScience,NationalUniversityofDefenseTech

7、nology,Changsha,Hunan410073,P.R.China76计算机通用。(2)循环展开。因为循环展开高效2并行程序的优化率地使用浮点运算和通用寄存器,减少了存储器的存储次数,同时减少了DoLoops的启动次数,在设计并行程序时要进行数据划分,数据划通常可以获得更高的性能。(3)转换除法运算到分完了以后要确定进行通信的数据并进行通信程乘法运算。一般来说,除法运算比其它算术运算序的设计。因此,对并行程序的优化大多都想到花费的时间更多。(4)减少内部函数的调用。调从上述两个方面着手,而容易忽略单机对局部数用内部函数需要花费一些执行时间,

8、可以通过使据进行串行计算的串行程序的优化。实际上,因用数学公式来减少内部函数的使用。(5)使用快为目前并行机的存储结构分层

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。