欢迎来到天天文库
浏览记录
ID:59316643
大小:12.00 KB
页数:1页
时间:2020-09-05
《进节点删除缓冲内存.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、都可删:最近经常会出现提交作业不上去,直接掉下来的情况,主要问题是出在计算节点的硬盘被临时文件占满,临时文件多数来自没有计算成功的gauss的积分文件。下面我介绍一下服务器的基本知识,再说一下如何删除计算节点的临时文件。首先要明确一点,我们的计算机集群分为三个部分,管理节点,计算节点和存储节点。管理节点由一台计算机组成,也就是我们登录的192.168.1.100这个ip所在的机器,编号为mu01,通过这台机器我们把计算作业通过pbs作业调度系统提交到计算节点上进行计算,计算节点由37台计算机组成,编号从cu01-cu35,以及node
2、1和node2. 第三部分是存储节点,由两台计算机组成su01和su02,我们每个人的账户以及所有你账户下的数据文件全都存储在这两个计算机里。 当发现提交作业状态为C,或者交上作业后就退出的情况,很可能是计算节点硬盘被占满了。这是需要清理一下计算节点。按照下面的步骤:1. 先确定你提交到了哪个节点出错的,然后进入节点,比如提交到第一个节点出错:rsh cu012.top一下,看有没有作业在运算,通过top能看出哪个用户在提交作业。如果没人提交作业,进入/tmp文件夹,删除里面所有的临时作业即可,如果top后发现有人在计算,就删除除了当
3、前登录用户外的所有临时文件夹。在/tmp下可以看到具体的名字。3.删除tmp下的文件夹需要root用户权限。在计算节点下,输入su,提示输入密码时,输入 。退出计算节点,用exit4.切记在用root删除临时文件试,不要把当前计算用户临时文件删掉删部分:1.rshcu**回车2.cd/tmp回车3.du-m回车(输入该命令后,会显示在该节点计算过的作业)4.rm-rf./*****回车(该命令为删除命令,大家看好了,自己的作业是否再算然后在删除)5.du-m回车(再次查看目录,是否删除成功)6.exit(从tmp中就退出来了,然后就一
4、切正常了)
此文档下载收益归作者所有