欢迎来到天天文库
浏览记录
ID:46286184
大小:423.00 KB
页数:12页
时间:2019-11-22
《机群管理系统安装简述》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、1机群结构介绍2.机群全局用户机群的全局用户管理采用NIS用户的宿主目录放在/export/home/username在该目录下放有用户的各种配置文件:.bashrc.bash_profile存放用户的私有数据管理员创建新的账号使用LCMS机群管理系统在console节点命令行方式:useradd-d/export/home/usernameusernamepasswdusernamecd/var/yp;make;cp/root/.rhosts/export/home/username在普通计算结点上yppasswd更改普通的密码,或通过LCMS修改2.机群全局用户用户环境变量的设
2、置用户私有的环境变量:用户主目录下/export/home/username/.bashrc和.bash_profile文件全局的所有用户相同的环境变量:每个节点/etc/bashrc文件3.登录到机群在windows系统下登录机群sshconsoleip登录到节点console后,可以执行命令rshc0101登录到其它任何节点。节点的名称和IP参考/etc/hosts文件yppasswd修改自己的密码4.如何运行mpi程序mpi并行环境/export/mpi/mpich:GNU编译的MPICH-1.2.5需要设置mpi并行环境的路径,例如使用mpichexportPATH=/ex
3、port/mpi/mpich/bin:$PATH4.如何运行mpi程序MPICH并行环境的使用mpicc–ocpicpi.c编辑列表文件hostlistc0101c0102c0103c0104rsh到列表中的最后一个节点mpirun-machinefilehostlist–np8cpi5.如何使用LJRS作业调度系统使用LJRS系统在管理节点提交作业,无需登陆到计算结点使用LJRS提交串行作业1)在普通用户下设置好LJRS的路径变量2)编写作业提交脚本[xyy@c0102lamrun]$catgaussrun.sh#!/bin/bashg98test397.comtest397.o
4、ut!普通的脚本3)qsubgaussrun.sh在提交提交作业的目录下会生成gaussrun.sh.e#和gaussrun.sh.o#两个标准输出和错误输出文件。#是当前作业号5.如何使用LJRS作业调度系统使用LJRS提交MPICH并行作业编辑文件脚本run.sh,然后qsubrun.sh#!/bin/bash###Jobname#LJRS-Ntest###Queuename#LJRS-qdpool###Numberofnodes#LJRS-lnodes=9:ppn=2#Thisjob'sworkingdirectorycd$LJRS_O_WORKDIR#Definenumbe
5、rofprocessorsNPROCS=`wc-l<$LJRS_NODEFILE`echoThisjobhasallocated$NPROCSnodes#changec0101tog0101,etc..cat$LJRS_NODEFILE
6、seds/c/g/>temphostlist#RuntheparallelMPIexecutablea.out/export/mpi/mpich/bin/mpirun-v-nolocal-machinefiletemphostlist-np$NPROCSxhpl#deletethetempfilerm-rftemphostlist6.实现机群系统并
7、行命令的脚本写一个并行脚本ido.sh#!/bin/bashforiin`cat$1`doecho”---------------$i----------------------”rsh$i$2done提供hosts列表文件hostsc4c0101c0102c0103c0104第一个参数$1表示使用哪个hosts列表第二个参数$2表示要执行的命令,如果命令中有空格,用引号””将命令括起来参数$i表示遍历hosts列表中的节点名称例如我们要察看前四个节点的/etc/yp.conf文件,使用命令./ido.shhostsc4“cat/etc/yp.conf”./ido.shhostsc
8、4“ps–uroot”./ido.shhostsc4“rcpconsole:/root/file/root”7.机群上下电顺序上电:开机顺序为console->计算节点;1)打开机柜底部电源开关2)手动按console节点前面板开关,给console节点加电3)管理节点启动开始引导Linux后,依次给c0101-c0XXX加电(每个节点计算结点加电时间隔1、2秒钟)4)启动作业调度系统start_ljrs下电:关机顺序为计算节点->console1)使用LCSM系统给
此文档下载收益归作者所有