欢迎来到天天文库
浏览记录
ID:32355234
大小:1.28 MB
页数:51页
时间:2019-02-03
《mpich作业递交方式的研究与改进》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、MPICH作业递交方式的研究及改进★第三章中在简单介绍一下高性能系统中比较常用到的网络技术,以及一些当前高性能系统中使用和研究的通信模型和协议。■●在第四章中主要介绍MPI的有关知识。第五章中详细研究了MPICB作业递交方式,并提出新的作业递交方法。第六章里介绍了对新方法(SBM作业递交方式)的试验测试,并对测试结果进行分析。最后,对整个论文进行了总结以及对未来工作的进一步展望。复旦大学硕士学位论文6●■MPICH作业递交方式的研究及改进第二章集群技术所谓集群,就是指一组通过高速网络连接的相互独立的服务器或PC机,它们在网络中表现为单一的系统,并以单一系统的模式加以
2、管理,共同为客户机提供服务。2.1集群系统组成结构图2.1集群系统组成结构示意图集群由节点和互连网络两大部分组成。根据功能,我们可以把集群系统中的节点划分为6种类型:用户节点、控制节点、管理节点、存储节点、安装节点、计算节点。1)用户节点用户节点是外部世界访问集群系统的网关,它是外部访问集群系统强大计算或存储能力的唯一入口,是整个系统的关键点。用户通常登录到这个节点上编译并运行作业。用户节点从用户那里接受任务,运行调度器(在本地或独立的”控制节点”上)将任务分派到其它计算机,并将运算结果返回给用户。2)控制节点控制节点主要承担两种任务:为计算节点提供基本的网络服务,
3、如DNS和NIS;调度计算节点上的作业,通常集群的作业调度程序(如PBS)一般运行在这个节点上。3)管理节点复开大学硕士学位论文7章冒h●MPICH作业递交方式的研究及改进管理节点是集群系统各种管理措施的控制节点,它是管理网络的控制点,监控集群中各个节点和网络的运行状况。通常的集群的管理软件也运行在这个节点上,能够使管理员从这一节点对集群中的任意节点进行监视和操作,并处理集群中所有计算机的曰志和报警信息。4)存储节点如果集群系统的应用运行需要大量的数据,则还需要一个存储节点。存储节点就是提供存贮共享的节点,是集群系统的数据存储器和数据服务器。为了使任务可以并行执行,
4、每台执行任务的节点必须能够访问同样的数据。存储节点通过网络共享(NFS)或其它方式来确保数据访问的同步。5)安装节点安装节点提供安装集群系统的各种软件,包括操作系统、各种运行库、管理软件和应用。它还必须开放文件服务,如FTP或NFS。6)计算节点计算节点是整个集群系统的计算核心。它的功能就是执行计算。集群中的大部分节点都是这种类型。集群系统中的节点虽然由多种类型的节点组成,但并不是说一台计算机只能是一种类型的节点。一台计算机所扮演的节点类型要由集群的实际需求和计算机的配置决定。在小型集群系统中,用户节点、控制节点、管珲节点、存储节点和安装节点往往就是同一台计算机,这
5、台计算机通常成为主节点(MasterNode)。在这种情况下集群就是由多个计算节点和一个主节点构成。集群中的节点通过高速网络相互联系,在通信网络的协议选择上可以使用普通的TCP/IP协议,也可以使用等效TCP/IP协议的精简协议,如AM(ActlveMessage)。很多时候为了简便起见,连接网络采用标准的以太网,除此以外。在市场上还有很多高性能的网络技术用于机群系统的连接,我们将在下章中详细介绍。2.2集群系统分类加按构架的形式和应用目的的不同,集群系统可以分为多种类型。复日大学硕十学位论文MPICH作业递交方式的研究及改进~2.2.1按构架形式分类●2.2.1.
6、1Beowulf集群1994年夏季,ThomasSterllng和DonBecker在CESDIS(TheCenterofExcellenceinSpaceDataandInformationSciences)用16个节点和以太网组成了一个计算机集群系统,并将这个系统命名为Beowulf集群系统。该集群系统提供了一种使用COTS(Commodityoftheshelf)硬件构造集群系统以满足特殊的计算需求的方法。这里的COTS是指PC和以太网这种广为应用的标准设备,它们通常可以由多家厂商提供,所以通常有很高的性价比。集群并行系统的这种构建方法很快从NASA传遍了整个
7、科研机构和社团,此后很多集群都采用Beowulf类似的构架。采用Beowulf的系统结构使得多个计算机组成的系统能够用于并行计算。系统通常有一个管理节点和多个计算节点构成,它们通过以太网(或其他网络)连接。管理节点监控计算节点,通常也是计算节点的网关和控制终端,当然它通常也是集群系统文件服务器。在大型的集群系统中,由于特殊的需求,这些管理节点的功能也可能由多个节点分摊。通常由最常见的硬件设备组成,例如PC机、以太网卡和以太网交换机。Beowulf系统很少包含用户定制的特殊设备,它通常采用那些廉价并且广为传播的软件,例如,Ltnux操作系统、并行虚拟机(PVM)和
此文档下载收益归作者所有