高性能计算集群调度策略优化和应用程序并行效率探究

高性能计算集群调度策略优化和应用程序并行效率探究

ID:6231069

大小:29.50 KB

页数:8页

时间:2018-01-07

高性能计算集群调度策略优化和应用程序并行效率探究_第1页
高性能计算集群调度策略优化和应用程序并行效率探究_第2页
高性能计算集群调度策略优化和应用程序并行效率探究_第3页
高性能计算集群调度策略优化和应用程序并行效率探究_第4页
高性能计算集群调度策略优化和应用程序并行效率探究_第5页
资源描述:

《高性能计算集群调度策略优化和应用程序并行效率探究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、高性能计算集群调度策略优化和应用程序并行效率探究  摘要首先介绍高性能计算的相关背景和高性能计算集群,其次介绍了集群作业调度系统策略优化的情况和效果,然后利用实验来检验了实际应用环境中并行效率随核数和问题规模变化的趋势并给出了使用建议,最后提出了下一步研究工作展望。关键词高性能计算;集群;作业调度系统;并行效率中图分类号:TP274文献标识码:A文章编号:1671-7597(2013)20-0031-02随着我国越来越多高性能集群系统的建成,越来越多的计算任务运行于其上,如何用好高性能计算成为了一个重要的问题。在时间紧、进度急、对计算资源需求量大的情况下,在同样的软硬件条件

2、下,尽可能多的满足用户的需求成了迫切需要解决的问题;同时,用户也越来越关注的应用程序的并行效率问题,提高效率能有效的减少用户的计算时间,既加快了进程,又能在同样时间内为更多的用户提供服务。应对以上两个问题,我们在调查用户需求的基础上,进行了相应研究,并取得了一些进展。1国内外高性能计算集群现状介绍1.1高性能计算简介8高性能计算机,作为现代国家经济和科技实力的综合体现之一,促进了经济、科技发展,社会进步和国防安全。目前,高性能计算科学与技术已经成为世界各国竞相争夺的战略制高点。一些发达国家和发展中国家纷纷制定战略计划,提出很高目标,投入大量资金,加速研究开发步伐。随着大规模

3、集成电路技术的飞速发展,以多中央处理器核心为基础的高性能计算机得到了迅猛发展。1.2集群系统简介集群系统是一组通过高速网络互联的、相互独立的计算机,并且以单一系统的模式加以管理。集群系统正式通过充分利用集群中每一台计算机的资源,才使得复杂运算的并行处理得以实现。和传统高性能计算机技术相比,集群技术利用服务器作为节点,因此其造价低;在系统造价低廉的同时,又没有牺牲运算速度,能够完成大运算量的计算。除此之外,集群系统也具有较高的响应能力,能够满足当今日趋增加的信息服务的需求。随着并行计算技术的发展,集群系统的应用越来越广泛,集群系统在完成大规模的计算任务方面的优势越来越得到体现

4、。8一种较为常见的高性能计算机采用Linux开源操作系统和一些免费软件来搭建完成,并用于进行并行运算。这一类集群被称为Beowulf集群。这中集群运行特定的程序,用来发挥高性能集群的并行计算能力。而运行于Beowulf集群上的程序一般应用特定的运行库,比如专为科学计算设计的数学库和MPI库。2作业调度系统策略优化2.1作业调度系统简介接收用户提交的请求,并根据调度规则以及对作业的要求挑选合适的计算资源来完成作业的系统称为作业调度系统。对用户而言,在作业调度系统的帮助下,高性能计算集群系统就可以被视为一台具备很多中央处理器单元的大型服务器。这个集群系统可以被多个用户同时使用。

5、作业调度系统管理用户提交的各类作业,根据不同的用户和作业需求,合理的分配资源,进而确保充分利用集群系统的计算能力,并尽可能快地得到运算结果。集群作业调度系统的基本要求如下:1)单一系统映像。2)资源负载监控。3)资源管理。4)策略管理。5)负载分析。目前,国际上较为常用的作业调度系统有IBMPlatformLSf系统,PBSProfessional和微软WindowsHPCServer2008作业调度系统。IBMPlatform8LSF是一个强大的针对高要求,分布式高性能计算环境的作业负载管理平台。它提供了一系列综合的基于策略控制的智能调度功能。它还提供了作业信息统计功能,

6、便于管理员掌握用户使用情况和对其进行计费。2.2队列使用现状队列是作业调度系统进行策略调度管理的重要单元。同一个队列中的作业按顺序分发和运行。作业只有提交到指定队列才能够运行。在本次实验环境下,同一个应用程序类型的作业被提交到一个队列,按照相同的队列配置参数运行。不同的队列按照相应配置生效。2.3Fairshare调度策略默认情况下,作业调度系统按照先到先得策略。按照这种策略,作业按照提交顺序依次执行。在这种情况下,一旦某个用户一次性提交了大量的作业并占据了所有计算资源,则在其后其他用户提交作业将不得不等到计算资源被释放的时候才能运行。这样的情况应该避免。为此,我们将Fai

7、rshare调度策略引用于作业管理。Fairshare策略的原理是对不同的用户自动设置优先级,按照优先级来确定作业分发和运行的顺序。优先级是动态变化的,变化的根据是此用户已经消耗的计算资源和当前的share数目。已经消耗的计算资源较少和share数目较多的用户将拥有较高的作业执行度,其作业将更有可能被分发和运行。8应用Fairshare策略有效避免了用户一家独占计算资源的情况,提高了计算资源使用的公平性。2.4应急队列的设置和使用在高性能计算机使用过程中,经常会出现以下两种作业。1)要求短时间内计算完成,所需CPU

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。