欢迎来到天天文库
浏览记录
ID:21369182
大小:536.50 KB
页数:42页
时间:2018-10-21
《作业调度系统》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、作业调度系统曙光信息产业(北京)有限公司内容任务管理系统概述作业调度系统PBS作业调度系统作业调度系统的使用机群使用中的问题机群结构的松散性(单一系统映象)节点类型的差别(CPU类型、内存大小、数量等)系统资源丰富(节点/CPU)用户不同类型的作业(串行/并行)用户可以使用资源的限制任务管理系统的功能单一系统映象机群松散的结构的整合系统资源整合异构系统的整合多用户的管理用户提交的任务的统一安排,避免冲突用户权限的管理非授权用户的控制任务管理系统的简史任务管理系统的分类基于进程级别的调度由机群中的操作系统或者运行时Runtime内部
2、支持,对运行的作业进行监控;以实现机群内的透明调度、以及自动优化进程的分配和平衡负载基于作业级别的调度这种方式由独立的作业管理系统实现。该系统通过专门的入口,接收用户提交的任务,送入相应的队列等待调度;并在适当的时机分配资源,为任务创建作业,将作业提入运行,在作业运行结束后完成收尾工作,并提供记帐功能。管理员和用户还可以在机群中查询并预订符合要求的资源,,从而实现对作业和资源的全程交互控制。任务管理系统的比较管理实现级别进程级作业级调度方式透明,基于最小负载可以基于网络拓扑/程序特性/负载/自定义策略调度管理层次低级,仅根据局部信
3、息高级,根据全局信息负载均衡方式支持动态负载均衡支持静态负载均衡;如有checkpoint功能,可支持动态负载均衡资源共享仅能够共享硬件资源可以共享硬件、软件和证书等资源服务质量Qos可能造成大作业饥饿,无Qos只要策略适当,可以保证Qos机群一致性的层次入口不一致,仍为多机系统;可以提供存储一致性提供单一系统入口和存储一致性对用户权限、资源和作业的高级管理策略无法实现能够很好地实现系统结构规模可扩展如果规模过大,会遇到前述的O(㎡)的通讯问题,难以扩展通讯量与系统规模成线形放缩,可以很好的扩展对作业类型的限制如前述,不适合于系统
4、调用较多的程序(如I/O密集型)对程序类型无限制内容任务管理系统概述作业调度系统PBS作业调度系统作业调度系统的使用作业管理的组成资源管理器:管理集群的硬件资源及认证信息等队列管理器:管理当前所有已提交但还未完成的作业调度器:为作业分配资源作业管理系统的结构作业特性比较系统特性SGELSFOPENPBSPBSPRO支持异构平台Unix&NT,多硬件Unix&NT,多硬件仅Unix,多硬件仅Unix,多硬件用户操作接口API/GUI/CLI/WEB,管理复杂API/GUI/CLI/WEB,管理方便API/GUI/CLI,功能少API
5、/GUI/CLI/WEB,管理方便支持DRMAA支持不支持支持支持支持POSIX批处理API标准支持不支持支持支持源代码开放开放不开放开放付费后开放用户文档支持非常详细非常详细较简单详细支持批处理作业支持支持支持支持支持交互式作业支持支持不支持支持支持海量作业组支持支持不支持支持支持并行作业支持支持支持支持支持PVM/MPI支持,功能强支持,功能强大支持,功能弱支持,功能强内容任务管理系统概述作业调度系统PBS作业调度系统作业调度系统的使用PBS作业调度系统PBS最初由NASA的Ames研究中心开发,为了提供一个能满足异构计算网络
6、需要的软件包。它力求提供对批处理的初始化和调度执行的控制,允许作业在不同主机间的路由。PBS的技术特色力求控制对批处理的初始化和调度执行,允许作业在不同主机间的路由。独立的调度模块存有各个可用的排队作业、运行作业和系统资源使用信息,并且允许系统管理员定义资源和每个作业可使用的数量。在作业调度策略上,PBS提供了默认的公平共享和独占FIFO调度策略,还提供了TCL、BACL、C三种过程语言和调度类,与定义了一些调度需要的函数和完整的API,方便实现新的调度策略。提供文件传送,FileStage-in和Stage-out。满足POSI
7、X1003.2d标准,支持作业依赖,和完整的安全认证。提供用户映射功能,使PBS能用于用户不一致的系统中。PBS的结构PBS的组成服务器:pbs_server调度器:pbs_sched执行器:pbs_mom命令行:用户脚本,管理命令等PBS的基本原理PBS的优缺点支持系统级检查点功能(需底层操作系统支持)很好的大规模扩展性独立的调度模块**支持作业依赖符合POSIX1003.2d标准-只支持Unix类操作系统-多集群协作功能有限-不支持用户级检查点功能术语节点(node)一个单一的操作系统映像,一个统一的虚拟内存映像一个个或多个c
8、pu,一个或多个IP地址的计算机系统被称之为一个节点。通常执行主机(executionhost)也被称之为节点。节点属性队列、服务器和节点都有与自己相关的属性,这些属性提供控制信息。与节点相关的属性有:状态、类型、虚拟处理器的个数、作业列表(本节点
此文档下载收益归作者所有