LSF作业管理系统使用方法

LSF作业管理系统使用方法

ID:37847873

大小:66.00 KB

页数:7页

时间:2019-06-01

LSF作业管理系统使用方法_第1页
LSF作业管理系统使用方法_第2页
LSF作业管理系统使用方法_第3页
LSF作业管理系统使用方法_第4页
LSF作业管理系统使用方法_第5页
资源描述:

《LSF作业管理系统使用方法》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、LSF作业管理系统使用方法这份文档将指导您通过LSF提交和管理作业。文档包含了使用LSF提交、查看、删除作业的相关内容。遵循文档的操作规范和反馈方法,将帮助您顺利完成工作。也欢迎大家对文档内容提出建议,谢谢!Contents [hide] ·1 通过LSF查看集群运行状态o1.1 查看LSF计算节点列表bhostso1.2 查看LSF队列bqueueso1.3 查看计算节点负载lsload·2 使用LSF提交作业bsubo2.1 手动提交作业o2.2 交互式批量提交o2.3 编写LSF作业控制脚本o2.4 一个功能更完整的LSF作业控制脚本·3 其他作业管理操

2、作o3.1 查看作业状态bjobso3.2 终止作业bkillo3.3 监视作业输出bpeeko3.4 作业历史信息bhist·4 参考资料通过LSF查看集群运行状态查看LSF计算节点列表bhosts#bhostsHOST_NAMESTATUSJL/UMAXNJOBSRUNSSUSPUSUSPRSVfat01ok-1600000fat02ok-1600000fat03ok-1600000fat04ok-1600000fat05ok-1600000fat06ok-1600000fat07ok-1600000fat08ok-1600000fat09ok-16000

3、00fat10ok-1600000......查看LSF队列bqueues查看所有队列的整体信息:#bqueuesQUEUE_NAMEPRIOSTATUSMAXJL/UJL/PJL/HNJOBSPENDRUNSUSPcpu40Open:Active----2072020720fat40Open:Active----0000gpu40Open:Active----28802880mic40Open:Active----0000cpu-fat40Open:Active----160160查看某个队列的信息:#bqueuesfatQUEUE_NAMEPRIOSTAT

4、USMAXJL/UJL/PJL/HNJOBSPENDRUNSUSPfat40Open:Active----0000查看计算节点负载lsload查看整体负载:#lsloadHOST_NAMEstatusr15sr1mr15mutpglsittmpswpmemnode011ok0.00.30.40%0.0049024193G62G61Gnode039ok0.00.60.50%0.0049024194G62G61Gnode041ok0.00.00.00%0.0049024194G62G61Gnode050ok0.00.00.00%0.0049024194G62G60

5、Gnode064ok0.00.70.60%0.0049024194G62G61Gnode077ok0.00.70.50%0.0049024194G62G61G.....查看某个节点的负载:#lsloadnode001HOST_NAMEstatusr15sr1mr15mutpglsittmpswpmemnode001ok0.30.10.11%0.00332152G62G61G使用LSF提交作业bsub手动提交作业LSF使用bsub提交作业。bsub命令的格式是:bsub-nZ-qQUEUENAME-iINPUTFILE-oOUTPUTFILECOMMAND其中:

6、Z提交作业需要的线程数,-q指定作业提交的队列。如果不添加-q选项,系统将把作业提交到默认的作业队列。 INPUTFILE表示程序需要读入的文件名,OUTPUTFILE表示输出文件名,作业提交后的输出到标准输出信息将会保存在这个文件中。对于串行作业,COMMAND可以直接使用您的程序名。例如,将串行程序mytest的通过LSF提交:bsub-n1-qq_default-omytest.out./mytest对于MPI并行作业,COMMAND的格式为-ampich_gmmpirun.lsfPROG_NAME。例如,将并行程序mytest,通过LSF提交,使用16

7、个线程运行这个作业:bsub-n16-qq_default-omytest.out-ampich_gmmpirun.lsf./mytest交互式批量提交使用bsub还可以启动一个交互式的shell环境,一次提交多个运行参数相同的并行作业。例如下面的操作:#bsubbsub>-n16bsub>-qq_defaultbsub>-ooutput.txtbsub>COMMAND1bsub>COMMAND2bsub>COMMAND3等价于:bsub-n16-qq_default-ooutput.txtCOMMAND1bsub-n16-qq_default-ooutput

8、.txtCOMMAND2bsub-n1

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。