欢迎来到天天文库
浏览记录
ID:40160402
大小:529.21 KB
页数:13页
时间:2019-07-24
《吕梁超算资源用户使用手册》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、吕梁高性能云计算中心TH-2用户手册(试用版V1.0)目录1.TH-2作业提交.....................................-1-1.1状态查看命令..................................-1-1.1.1结点状态查看yhinfo或yhi..................-1-1.1.2作业状态信息查看yhqueue或yhq.............-1-1.2提交作业......................................-
2、2-1.2.1交互式作业提交yhrun.......................-2-1.2.2批处理作业yhbatch.........................-5-1.2.3分配模式作业yhalloc.......................-8-1.3任务取消yhcancel..............................-9-1.4备注..........................................-9-附录(简明常用命令)...........
3、.....................-10-1.TH-2作业提交在TH-2中,所有在计算结点中运行的串行或并行应用程序,都必须通过资源管理系统来提交运行。资源管理系统首先将用户提交的应用程序构造成作业进行排队处理,然后根据TH-2的实时运行资源状态,决定何时以及在哪些计算结点中加载应用程序的运行,不同的应用程序之间不存在资源的竞争冲突,用户也可以通过作业管理系统来监控应用程序的运行。TH-2用户手册(试用版V1.0)1.1状态查看命令在用户提交作业前,应查看系统的使用情况,这样利于用户根据系统使
4、用情况,对相应的计算结点进行选择。1.1.1结点状态查看yhinfo或yhiyhi为yhinfo命令的简写,用户可以使用yhi或者yhinfo命令查看结点的使用情况,从而根据情况做出选择。其中PARTITION表示分区,TIMELIMIT表示该分区的时间限制,NODES表示结点数,STATE表示结点运行状态其中down表示未启动,idle表示启动后出于空闲状态,allocated表示结点已经分配了一个或多个作业,NODELIST为结点列表。1.1.2作业状态信息查看yhqueue或yhqyhq为yhu
5、eue命令的简写,用户可以使用yhq或yhqueue命令查看系统中各计算结点的运行情况。其中JOBID表示任务ID,Name表示任务名称,USER为用户,TIME为已运行时间,NODES表示占用结点数,NODELIST为任务运行的结点列表。获取的jobid,用户在作业取消命令yhcancel中会使用到。-1-用户可以使用yhq查看自己提交的作业,为了保证用户的数据安全,普通用户通过yhq只能看到自己提交的作业。1.2提交作业目前TH-2部署的资源管理系统包括多种作业提交方式,交互作业提交方式yhrun
6、,批处理作业提交方式yhbatch和分配模式yhalloc。作业终止方式为yhcancel命令,需要获取作业的jobid,如前所述,jobid可以通过yhq命令查看获得。本手册,为了简化和方便用户,只对相关命令做简单介绍,用户如需更多参数选择,则可以通过相应命令后加入--help的方式,获取帮助信息,从而满足用户需求。1.2.1交互式作业提交yhrun系统中作业的运行分成两步:资源分配与任务加载。对于批处理作业,使用yhbatch命令提交作业脚本,作业被调度运行后,在所分配的首个结点上执行作业脚本,在
7、作业脚本中使用yhrun命令加载作业任务。对于交互式作业,资源分配与任务加载两步均通过yhrun命令进行:当在登录shell中执行yhrun命令时,yhrun首先向系统提交作业请求并等待资源分配,然后在所分配的结点上加载作业任务。yhrun运行的主要格式如下:yhrun[options]programyhrun包括多个选项,用户最常使用的选项如下:-n,--ntasks=ntasks指定要运行的进程数。请求yhrun分配/加载ntasks个进程。省缺的情况是每个CPU运行一个进程,但是-c参数将改变此
8、省缺值。-N,--nodes=minnodes[-maxnodes]请求为此作业至少分配minnodes个结点。调度器可能决定在多于minnodes个结点上启动作业。可以通过指定maxnodes限制最多分配的结点数,如“--nodes=2-4”。最少和最多结点数可以相同以便指定确切的结点数,如“--nodes=2-2”将请求两个并且仅仅两个结点。如果没有指定-N,省缺的行为是分配足够的结点以满足-n选项的要求。-2--p,--partition=part
此文档下载收益归作者所有