hpl2.0安装配置wiki

hpl2.0安装配置wiki

ID:34707809

大小:57.22 KB

页数:3页

时间:2019-03-09

hpl2.0安装配置wiki_第1页
hpl2.0安装配置wiki_第2页
hpl2.0安装配置wiki_第3页
资源描述:

《hpl2.0安装配置wiki》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、HPLbenchmark2.0安装与配置一、HPL简介HPL即HighPerformanceLinpack,也叫高度并行计算基准测试,通过对高性能计算机采用高斯消元法求解一元N次稠密线性代数方程组的测试,评价高性能计算机的浮点性能。它对数组大小N没有限制,求解问题的规模可以改变,除基本算法(计算量)不可改变外,可以采用其它任何优化方法。HPL是针对现代并行计算机提出的测试方式。用户在不修改任意测试程序的基础上,可以调节问题规模大小(矩阵大小)、使用CPU数目、使用各种优化方法等等来执行该测试程序,以获取最佳的性能。HPL采用高斯消元法

2、求解线性方程组。求解问题规模为N时,浮点运算次数为(2/3*N^3-2*N^2)。因此,只要给出问题规模N,测得系统计算时间T,峰值=计算量(2/3*N^3-2*N^2)/计算时间T,测试结果以浮点运算每秒(Flops)给出。二、HPL安装Reference:www.netlib.org/benchmark/hpl 已经编译的BLASCBLASATLAS库,fortran77/c编译器,并行环境MPICHPreStep:1.OS上安装G77编译器(CentOS,ArchLinux)2.OS上编译ATLAS库,该库会先对本地硬件环境

3、进行测试,安装时间2-4小时不等3.OS上安装MPICH2.0库。Ps:已编译过的库可以重复使用。Step1:下载HPL2.0并解压缩。Step2:编写Make文件。从hpl/setup目录下选择较适合本地环境的make模板复制到hpl文件夹下,文件名示例如:Make.Linux_PII_FBLAS文件代表Linux操作系统、PII平台、采用FBLAS库并根据本地环境做出修改ARCH:必须与文件名Make.中的一致TOPdir:指明hpl程序所在的目录MPdir:MPI所在的目录MPlib:MPI库文件LAdi

4、r:BLAS库或VSIPL库所在的目录LAinc、LAlib:BLAS库或VSIPL库头文件、库文件HPL_OPTS:包含采用什么库、是否打印详细的时间、是否在L广播之前拷贝L若采用FLBAS库则置为空,采用CBLAS库为“-DHPL_CALL_CBLAS”,采用VSIPL为“-DHPL_CALL_VSIPL”“-DHPL_DETAILED_TIMING”为打印每一步所需的时间,缺省不打印“-DHPL_COPY_L”为在L广播之前拷贝L,缺省不拷贝(这一选项对性能影响不是很大)CC:C语言编译器CCFLAGS:C编译选项LINKER:

5、Fortran77编译器LINKFLAGS:Fortran77编译选项(Fortran77语言只有在采用Fortran库是才需要)Step3:#makearch=,arch为上一步所定义。编译完成后,生成可执行文件xhpl(在hpl//bin目录下)。Step4:在bin目录下,XHPL为可执行文件,HPL.dat为配置文件。此时可以使用并行工具MPI测试是否正确安装。#mpirun–np4xhpl,xhpl文件需要完整路径。Step5:查看运行结果:R:它是系统的最大的理论峰值性能,按GFLOPS表示。如10

6、个PentiumIIICPU的Rpeak值。N:给出有最高GFLOPS值的矩阵规模或问题规模。正如拇指规则,对于最好的性能,此数一般不高于总内存的80%。Rmax:在Nmax规定的问题规模下,达到的最大GFLOPS。NB:对于数据分配和计算粒度,HPL使用的块尺度NB。小心选择NB尺度。从数据分配的角度看,最小的NB应是理想的;但太小的NB值也可以限制计算性能。虽然最好值取决于系统的计算/通信性能比,但有代表性的良好块规模是32到256个间隔。==============================================

7、===========T/VNNBPQTimeGflops----------------------------------------------------------------------------WC23C2C4728480232328031972.218.061e+03----------------------------------------------------------------------------

8、

9、Ax-b

10、

11、_oo/(eps*

12、

13、A

14、

15、_1*N)=0.0028792......PASSED

16、

17、

18、Ax-b

19、

20、_oo/(eps*

21、

22、A

23、

24、_1*

25、

26、x

27、

28、_1)=0.0015927......PASSED

29、

30、Ax-b

31、

32、_oo/(eps*

33、

34、A

35、

36、_oo*

37、

38、x

39、

40、_oo)=0.0002556......PASSED

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。