欢迎来到天天文库
浏览记录
ID:27186096
大小:1.74 MB
页数:33页
时间:2018-12-01
《低成本高能计算的实现与测试》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、低成本高性能计算的实现与测试昆明理工大学云南省计算机技术应用重点实验室谭伟良2008-11-27实验室介绍昆明理工大学云南省计算机技术应用重点实验室是云南省在信息技术方向唯一的一所省级重点实验室。目前拥有教授级研究人员19人,中职21人,普通计算机人员80多名。多年来,在社会各界的大力支持下,云南省计算机技术应用重点实验室在承担、完成科研项目方面及实验室的开放运行、队伍建设、培养人才、实验室管理等方面,都取得了不少成绩,其科研的规模和水平均已具备较强的实力。研究所拥有一个由21台曙光服务器构成的理论峰值每秒超过1万亿次浮点运算能力的高性能计算集群,2台Sun的小型机,4台Sun
2、服务器,4台Dell的服务器,6台HP服务器,7台IBM服务器,台机40台,笔记本15台,拥有四个网络出口:校园网1G,网通150M,电信150M,联通150M。2概要相关介绍环境搭建性能测试心得体会3相关介绍目前,HPC的应用范围越来越广,除了一些特殊的应用需要高性能计算外,一些如:数据挖掘应用、图像处理业务、基因测序比对处理等领域也越来越需要高性能计算。科学计算领域更快的速度更高的精度更大的范围信息服务领域更好地整合、提高可管理性更高的吞吐率更高的可靠性4面临的问题但是,想要得到一个高性能解决方案,往往意味着要投入大量的金钱。国内:曙光4000A(10万亿次运算能力),市场
3、价格约为1亿人民币。曙光5000A(200万亿次运算能力),市场价格约为2亿人民币。国外能达到相同计算规模的超级计算机,价格大约是国内的5~6倍。一个小规模的高性能解决方案,也需要花上百万乃至上千万的成本投入。5低成本高性能计算的产生一方面是有限的成本投入,一方面是对高性能计算的迫切需要。怎样在这两者之间取得一个平衡点?因此,构建一个低成本、高性能的解决方案由此产生。6多种结构的比较结构特性SMPDSMMPPCluster可扩展性最差差强很强易管理性很强很强一般较差网络能力无需网络无需网络很强强并行编程方式共享变量共享变量、消息传递消息传递消息传递价格贵昂贵昂贵较低7环境搭建硬
4、件环境搭建软件环境搭建低成本考虑:1)从硬件上降低成本2)从软件上降低成本3)从日常维护费用上降低成本高性能考虑:1)使用高频、多核CPU2)使用优化的数学库3)优化网络环境8硬件环境搭建硬件选购:1)计算节点:对大量集群环境配置的经验性研究显示小型SMP平台最适合构建HPC集群,并且现在的多核技术已经达到平民化的程度,因此使用多路处理器的节点成为首选。9选用AMD处理器在很多领域中,需要对大量的数据进行处理。这种模式对每个节点上的性能及I/O吞吐量提出了很高要求。AMD皓龙处理器的直连架构和超传输总线(HyperTransport)技术,保证了低内存延时和缓存的一致性,避免了
5、系统扩展带来的性能瓶颈,可实现处理器核心之间的高速数据交换,提升节点性能,满足了应用的需求。以及其相对低廉的价格,是搭建一个低成本解决方案的重要因素。(更适合多核单节点的情况)102)网络一般在大中型集群中,往往会使用InfiniBand,Myrinet等高速网络。但是他们的价格都不菲,针对于小型的集群搭建,使用千兆网络已经能够满足小型集群的网络通讯的需要。11网络比较1213硬件材料清单21台曙光A620r-F服务器每台服务器的主要参数:2个AMDOpteron23522.1GCPU4G内存250GSATA2硬盘600W2U单电源曙光A系列双路主板一台华为千兆交换机若干千兆网
6、线14与同配置的其它服务器对比与HP、SUN的服务器相比,使用曙光服务器更具有价格优势。比曙光服务器高至少一倍的价格。15网络拓扑16实际运行中的机器17软件环境基本搭建(尽可能使用开源软件)操作系统:RHEL4U5并行环境:MPI1.2.7作业管理:OpenPBS2.3.16监控软件:Ganglia3.0.6数学库:GotoBLAS、Atlas、ACML18考虑因素考虑到成本与实际环境的因素,我们使用开源软件对我们这个集群进行管理和相关的应用。因为开源软件自身的局限性,不可能提供很好的集群管理机制。因此在较大规模集群方案中,如果还是使用开源的软件去对集群进行管理,日常的维护工
7、作量就会明显增多。(建议使用专门的集群管理软件:CSM(Linux)、SUNCluster3.0、DCMM系统监控DCMS集群管理)19软件系统配置有标准的C、C++、Fortran和Java等主流编译器,将来还要在这基础上安装其它的并行编程环境,如PVM、HPF、OpenMP、串行程序自动并行化工具、并行调试器、并行程序监控工具和并行数学库函数。还可以安装一些针对与某些领域的应用软件,如AccelrysMaterialStudio材料计算软件等。20开发模式支持串行程序、消息传递程序、SM
此文档下载收益归作者所有