资源描述:
《NFS+MPICH2 简单集群搭建》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、NFS+MPICH2简单集群搭建准备工作:Sudoapt-getinstallopenssh-server(masternode)Sudoapt-getinstallopenssh-client(slavenode)Sudoapt-getinstallnfs-kernel-server(masternode)Sudoapt-getinstallnfs-client(slavenode)Sudoapt-getinstallgcc(g++gfortran可选)加上所有用户名都是(h)NFS系统配置1.masternode(1)用命令sudovi/etc/ho
2、stname打开hostname文件,将主机名改为自己想要的名字(如node0),保存退出vi编辑器,然后用命令sudoreboot重启,CTR+ALT+t会在命令行窗口看到刚才改的名字;(2)用命令sudovi/etc/hosts打开hosts文件,配置hosts文件(如下面形式(3个节点))127.0.0.1localhost192.168.1.10node0192.168.1.11node1192.168.1.12node2注意:此时的node0必须与第一步改的一样否则启动不了mpich2)(3)第一步,利用命令cd/回到根目录,然后sudomkd
3、ircluster创建共享目录cluster。用ls–l或者ll查看刚建立的cluster目录,其属于root用户和root组。用命令sudochownh:h/cluster进行修改,再次参考会发现目录/cluster已经被改成我们所想要的用户和组;第二步,用命令sudovi/etc/exports(或者sudogedit/etc/exports)打开exports文件,并在文件末尾添加如下形式的东西/clusternode0(rw,sync,fsid=0,crossmnt,no_subtree_check)/clusternode1(rw,sync,f
4、sid=0,crossmnt,no_subtree_check)/clusternode2(rw,sync,fsid=0,crossmnt,no_subtree_check)这两句的意思是说将masternode0的/cluster目录共享给node1,node2,权限是读和写到此,masternode的NFS配置完毕。最后,运行sudoexportfs-rv使配置生效。2.slavenodes配置(每个slavenode)(1)用命令sudovi/etc/hostname打开hostname文件,将主机名改为自己想要的名字(如node0),保存退出vi
5、编辑器,然后用命令sudoreboot重启,CTR+ALT+t会在命令行窗口看到刚才改的名字;(2)用命令sudovi/etc/hosts打开hosts文件,配置hosts文件(如下面形式(3个节点))127.0.0.1localhost192.168.1.10node0192.168.1.11node1192.168.1.12node2保存退出。(3)挂载masternode的cluster目:用命令sudovi/etc/fstab(或者sudogedit/etc/fstab)打开fstab文件,并在文件末尾添加如下形式的东西node0:/cluste
6、r/clusternfsrw,async,auto,exec,nouser,suid00保存退出。节点之间的ssh无密码登录所有节点之间都执行相同的操作,在此以masternode为例进行操作注:pingnode1(pingnode2)看是否都能ping通,否则检查硬件和自己的配置,直到所有节点都ping通之后再继续下面的操作cdssh-keygen–trsa一路回车之后cd.ssh(进入.ssh目录)ls(会看到有id_rsa,id_rsa.pub两个文件,分别表示公钥和私钥)touchauthorized_keys(创建空文件authorized_k
7、eys,制作授权密钥)cpid_rsa.pub~/.ssh/authorized_keysscpid_rsa.pubnode1:~/.ssh/0.pubscpid_rsa.pubnode2:~/.ssh/0.pub分别进入node1,node2的.ssh目录执行cat0.pub>>authorized_keys所有node执行上面相同的操作之后,在每个节点分别执行sshnode*(*可以代表0,1,2中的一个),如果都不需要输入密码就能进入别的node则说明配置成功,否则检查,直到能无密码登录为止。利用exit退出登录。(可能出错,出错时将known-h
8、osts删除,重新执行(类似cat0.pub>>authorized_keys的