pbs作业调度应用与说明

pbs作业调度应用与说明

ID:5740605

大小:49.00 KB

页数:11页

时间:2017-12-23

pbs作业调度应用与说明_第1页
pbs作业调度应用与说明_第2页
pbs作业调度应用与说明_第3页
pbs作业调度应用与说明_第4页
pbs作业调度应用与说明_第5页
资源描述:

《pbs作业调度应用与说明》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、PBS(PortableBatchSystem)最初由NASA的Ames研究中心开发,主要为了提供一个能满足异构计算网络需要的软件包,用于灵活的批处理,特别是满足高性能计算的需要,如集群系统、超级计算机和大规模并行系统。PBS的主要特点有:代码开放,免费获取;支持批处理、交互式作业和串行、多种并行作业,如MPI、PVM、HPF、MPL;PBS是功能最为齐全,历史最悠久,支持最广泛的本地集群调度器之一.PBS的目前包括openPBS,PBSPro和Torque三个主要分支.其中OpenPBS是最早的PBS系统,目前已经没有太多后续开发,PBSpro是PBS的商业版本,功能

2、最为丰富.Torque是Clustering公司接过了OpenPBS,并给与后续支持的一个开源版本.PBS的应用不同于一般的直接运行:mpirun–npnumber./executable_file直接运行上句,则只能在单个节点上进行并行计算。如果要在多个节点上并行执行则要写machinefile或p4pgfile,两种文件的具体写法参考张林波等《并行计算导论》。运行命令分别为:      mpirun–machinefilefilename      mpirun–p4pgfilename应用PBS提交任务则会形成任务队列,依次执行,有效分配资源,避免资源竞争。否则C

3、PU时间片会轮流分配给各个人的任务,从而影响所有人的正常作业。torquePBS提供对批处理作业和分散的计算节点(Computenodes)的控制。·安装Torque组件:在一个节点上(headnode)安装pbs_server,所有计算节点上安装pbs_mom,所有计算节点和提交节点上安装PBS客户端。至少做最基本的配置,使Torque系统跑起来,也就是使pbs_server能知道该和哪些机器通话。·在pbs_server上创建一个作业提交队列。·在集群的所有节点上指定一个clustername作为property。这可以用qmgr命令做到。比如:          

4、       qmgr-c"setnodenodeproperties=cluster-name"。·确保作业可以提交到节点上去。这可以通过使用qsub命令做到。比如:                echo"sleep30"

5、qsub-lnodes=3。1.0作业提交系统Torque个人安装总结(PBS)1.1Torque安装(在master管理结点上)1.解压安装包tar-zxvftorque-2.3.0.tar.gz2.进入到解压后的文件夹./configure--with-default-server=mastermakemakeinstall3.打包,

6、r>必须是个普通用户1)[root@mastertorque-2.3.0]#./torque.setup2)[root@mastertorque-2.3.0]#makepackages把产生的tpackages,torque-package-clients-linux-x86-64.sh,torque-package-mom-linux-x86-64.sh拷贝到所有节点。3)客户端安装[root@mastertorque-2.3.0]#./torque-package-clients-linux-x86_64.sh-install[root@masterto

7、rque-2.3.0]#./torque-package-mom-linux-x86_64.sh-install4)编辑/var/spool/torque/server_priv/nodes(需要自己建立)加入如下内容master  np=4node01np=4........node09np=45)启动pbs_server,pbs_sched,pbs_mom,并把其写到/etc/rc.local里使其能开机自启动。6)创建队列[root@master~]#qmgrcreatequeuestudentssetqueuestudentsqueue_type=Executi

8、onsetqueuestudentsPriority=40setqueuestudentsresources_max.cput=96:00:00setqueuestudentsresources_min.cput=00:00:01setqueuestudentsresources_default.cput=96:00:00setqueuestudentsenabled=Truesetqueuestudentsstarted=True4、在node0x(x=1-9,计算结点上)[root@node0xtorque-2.3.0]#./torq

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。