欢迎来到天天文库
浏览记录
ID:11415132
大小:939.00 KB
页数:8页
时间:2018-07-11
《centos5.5下mpi并行计算环境的建立》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、厦门市安腾科技有限公司技术部Centos5.5下MPI2并行计算环境的建立一、配置前的准备工作假设机群是2个节点,分别为c1,c2。1.安装Linux(CentOS5.5)系统,并保证每个节点的sshd服务能正常启动。笔者并没采用真实的2台机器,而是利用虚拟机(Hyper-v)在一台装有Windowsserver2008R2系统的机器上安装多个Linux系统进行模拟。注意事项:(1)因为笔者采用mpich2-1.3.2p1.tar.gz,此版本对gcc、autoconf等软件包版本要求较高,为避免出错,尽量安装最新的Linux系统。(2)在使用Hyper-
2、v安装Centos5.5时,会发现进入Centos系统后,网卡无法识别的问题。所以在刚创建完虚拟机时,要将原来默认创建的网卡移除,操作“设置à硬件à添加硬件à旧版网络适配器”,这样才可以正常使用。2.为每个节点分配IP地址c1:172.20.20.169,c2:172.20.20.1688厦门市安腾科技有限公司技术部3.配置/etc/hosts文件,该文件可以实现IP地址和机器的对应解析,所有节点的该文件均要按下面的内容修改:172.20.20.169c1172.20.20.168c2同时一定要注销或者删除这一行:127.0.0.1localhost,否则
3、在用命令mpdboot-n2-f/root/mpd.hosts同时开启各节点mpd服务时,会出现“mpdboot_c1(handle_mpd_output412):failedtohandshakewithmpdonc2;recvdoutput={}”的错误通过以上配置后节点之间能够通过各节点的机器名称相互访问。例如,可以通过pingc2进行测试。注意事项:该测试必须在关闭Linux防火墙的条件下进行,否则可能失败。永久生效:chkconfigiptableson/off(重启生效)即时生效:serviceiptablesstart/stop(重启失效)二
4、、挂载NFS文件系统由于MPICH的安装目录和用户可执行程序在并行计算时需要在所有节点保存副本,而且目录要相互对应,每次一个节点一个节点的复制非常麻烦,采用NFS文件系统后可以实现所有节点内容与主节点内容同步更新,并自动实现目录的对应。NFS文件系统使得所有机器都能以同样的路径访问服务器上保存的文件,访问方法如同对本地文件的访问。通常我们会将MPICH8厦门市安腾科技有限公司技术部的安装目录及并行程序存放目录配置为NFS共享目录,这样可以省去将文件向各个节点复制的麻烦,大大提高工作效率。NFS文件系统的配置方法示例如下(我们在c1上设置NFS服务器,配置需
5、要在root用户下完成)。1.服务器端配置方法(下面的配置只在主节点进行)(1)/etc/exports文件配置在文件/etc/exports中增加以下几行:/root172.20.20.0/255.255.255.0(rw,sync,no_root_squash,no_subtree_check)/usr/local172.20.20.0/255.255.255.0(rw,sync,no_root_squash,no_subtree_check)(为什么共享这两个目录,mpich2需要安装在c1的/usr/local目录下,要使c2也直接使用,所以要把这
6、个目录共享出来;/root目录下有.bashrc文件,是设置环境变量用的,如果c1修改了该文件,而又没有将/root目录共享出来给c2使用,c2就无法运行mpich2了)这几行文字表明NFS服务器172.20.20.0网段的节点共享其/usr/cluster目录(目录必须存在),并使这些节点具有相应的权限(可查询相关的文档)。如有更多的节点可按此方法填写。如果期间有修改共享文件夹目录,则需要用以下命令刷新一下:exportfs-rv(2)启动NFS服务启动NFS服务只需要以下两个命令:serviceportmapstart(该服务在Centos中已经自动运
7、行,可不是用)8厦门市安腾科技有限公司技术部注:在最新的内核中,NFS守护进程改为rpcbind,如是新内核,启动NFS守护进程的命令是“servicerpcbindstart”。servicenfsstart到此c1服务器已可以向其他两个节点提供/usr/local和/root目录的文件共享。2.客户端c2配置方法(需要在所有子节点做同样的配置)。(1)建立共享目录。建立与服务器相同的共享目录用于共享服务器文件:由于我NFS服务器共享的2个目录是已经存在的,所以这一步可以省略。(2)查看服务器已有的共享目录(这步可省略)。showmount-e172.2
8、0.20.169通过这条命令我们可以查看IP地址为172.20.2
此文档下载收益归作者所有