并行计算-多媒体课件-并行体系结构-lec04-performance

并行计算-多媒体课件-并行体系结构-lec04-performance

ID:38466466

大小:389.00 KB

页数:36页

时间:2019-06-13

并行计算-多媒体课件-并行体系结构-lec04-performance_第1页
并行计算-多媒体课件-并行体系结构-lec04-performance_第2页
并行计算-多媒体课件-并行体系结构-lec04-performance_第3页
并行计算-多媒体课件-并行体系结构-lec04-performance_第4页
并行计算-多媒体课件-并行体系结构-lec04-performance_第5页
资源描述:

《并行计算-多媒体课件-并行体系结构-lec04-performance》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、ParallelComputerArchitecture并行计算机体系结构Lecture5OverviewReviewofLec4Benchmark性能提高(任务划分、分配、调度)ReviewofLec4并行计算机的性能评测加速比性能定律并行系统的加速比是指对于一个给定的应用,并行算法(或并行程序)的执行速度相对于串行算法(或串行程序)的执行速度加快了多少倍。Amdahl定律Gustafson定律SunNi定律可扩放性评测标准等效率度量标准等速度度量标准平均延迟度量标准OverviewReviewofLec4Benchmark性能提高(任务划分、分配、调度)程序级性能

2、评测基准测试程序(Benchmark)一组标准的测试程序提供一组控制测试条件步骤的规则说明(测试平台环境、输入数据、输出结果和性能指标等)基准测试程序的分类真实程序:Ccompiler,Texteditor,spice核心程序:Livermore24loops,Linpack小测试程序:皇后问题、排序问题、求素数合成测试程序:Whetstone、Dhrystone应用:科学计算、商业应用、网络服务、多媒体应用宏观测试程序(Macro-benchmark):计算机系统作为一个整体来测试其性能微观测试程序(Micro-benchmark:测试机器的某一特定方面的性质Ben

3、chmarkSuites程序级性能评测(cont‘d)类型名称意义用途宏观测试程序PARKBENCH并行计算NAS并行计算CFDSPEC混合基准测试程序Splash并行计算STAP信号处理TPC商业应用微观测试程序LINPACK数值计算(线性代数)LMBECH系统调用和数据移动(UNIX)STREAM存储器带宽Whetstone和Dhrystone测试程序Whetstone:浮点性能合成测试程序最早用Algol-60写成,后用Fortran改写英国国立物理实验室最频繁使用的数值计算程序段。转换到称之为Whetstone虚拟计算机上的指令包括整数运算、浮点运算,涉及到数

4、组下标索引、子程序调用、参数传递、条件转移和三角/超越函数等,使用Kwhetstone/s数来度量。Dhrystone测试整数与逻辑运算性能合成测试程序用Ada、C和Pascal写成CPU密集(CPU-intensive)型测试程序,包括很多整型语句与逻辑语句的小循环,使用KDhrystone/s数来度量VAX11/780(1MIPS)的性能为1.7KDhrystone/sWhetstone和Dhrystone的缺点:它们不能预测用户程序性能,对编译程序比较敏感。LINPACK测试程序机器名称处理器数Rmax(Gflops)Nmax(阶数)N1/2(阶数)Rpeak(

5、Gflops)IntelASCIoptionRed7264.1068215,00053,4001,453CP-PACS2048368.2103,68030,720614IntelParagonXP/SMP6768281.1128,60025,700338NumericalWindTunned167229.766,13218,018281FujitsuVpp500/153153200.662,73017,000245CrayT3D10241024100.581,92010,2241521BMSP2-T251288.473,50020,150136NECSX-4/3232

6、66.5315,3601,79264Fortran语言求解线性代数方程组的子程序,于1979年正式发布了LinPACK包,使用BLAS1测试的基准是用全精度64位字长的子程序求解100阶线性方程组的速度,测试的结果以MflopsLAPACK测试程序和ScaLAPACK测试程序LAPACK:LinPACK作为测试程序现在仍很有生命力,但作为实际求解线性代数问题的软件包已经落伍了。1992年推出了代替LinPACK及EisPACK(特征值软件包)的LAPACK,它使用了数值线性代数中最新、最精确的算法,同时采用了将大型矩阵分解成小块矩阵的方法,从而可有效地使用存储器。LA

7、PACK是建立在BLAS1、BLAS2和BLAS3基础上的,其中BLAS2执行矩阵-向量运算,BLAS3执行矩阵-矩阵运算ScaLAPACK:LAPACK的增强版,主要为可扩放的、分布存储的并行计算机而设计ScaLAPACK支持稠密和带状矩阵上各类操作,诸如乘法、转置和分解等。ScaLAPACK例程可以加入多个并行算法,并且可根据数据分布、问题规模和机器大小选择这些算法,然而用户却不必关心这些细节LMBENCH和STREAM测试程序LMBENCHSGI的LarryMcVoy所维护用于测试不同Unix平台上OS开销以及处理器、高速缓存、主存、网络和磁盘

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。