HACMP工作原理

HACMP工作原理

ID:41106722

大小:809.50 KB

页数:10页

时间:2019-08-16

HACMP工作原理_第1页
HACMP工作原理_第2页
HACMP工作原理_第3页
HACMP工作原理_第4页
HACMP工作原理_第5页
资源描述:

《HACMP工作原理》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、HACMP工作原理1.HACMP网络HACMP的工作原理是利用LAN来监控主机及网络、网卡的状态。在一个HACMP环境中有TCP/IP网络和非TCP/IP网络。TCP/IP网络即client访问的公共网,如果是一个并行数据库环境,那么还必需一个不允许client访问的私网,用以lockmanager对数据进行协同工作。当然本方案中只需一个普通的公网即可,该网可以是大多数AIX所支持的网络,如Ethernet,T.R.,FDDI,ATM,SOCC,SLIP,等等,在本方案中是10M/100M以太网。非TCP/IP网络用来

2、为HACMP对cluster中的各节点进行监控而提供的一个替代TCP/IP的通讯路径,它可以是用RS232将各节点连接起来,也可以是将各节点的SCSI卡或SSA卡设置成TargetMode方式。为了简单方便,本方案中我们采用RS232串口连接的方式,这也是绝大多数用户采用的方式。2.HACMP故障类型HACMP将诊测并响应于三种类型的故障:1网卡故障,2网络故障,3节点故障。下面就这三种故障分别进行介绍。网卡故障前面讲到,HACMP的群集结构中,除了TCP/IP网络以外,还有一个非TCP/IP网络,方案中为RS232连

3、接,它实际上是一根“心跳”线,专门用来诊测是节点死机还是仅仅是网络发生故障。如下图所示,一旦节点加入了cluster(即该节点上的HACMP已正常运行),该节点上的各个网卡、RS232串口和Target-ModeSSA或SCSI就会不断地接收并发送Keep-Alive信号包,K-A的参数是可调的,针对以太网,当处于normal状态时,将每隔0.5秒发送一个K-A包,如果12个包丢失后HACMP确认对方网卡、或网络、或节点发生故障。如果在slow或fast状态,参数值又有所变化,不过这种变化对于整个的接管时间的影响非常之

4、小,以至通常可以不用去考虑。因此,有了K-A后,HACMP可以很轻易地发现网卡故障,因为一旦某块网卡发生故障,发往该块网卡的K-A就会丢失。此时nodeA上的clustermanager(HACMP的“大脑”)会产生一个swap-adapter的事件,并执行该事件的script(HACMP中提供了大部分通用事件的scripts,它们是用标准的AIX命令和HACMP工具来写的)。其过程如下图所示。每个节点上都有至少两块网卡,一块是serviceadapter,提供对外服务,另一块是standbyadapter,它的存在只

5、有clustermanager知道,应用和client并不知道。一旦发生swap-adapter事件后,clustermanager将原来的serviceadapter的IP地址转移到standbyadapter上,而standby地址转移到故障网卡上,同时网络上其他节点进行ARP的刷新。网卡互换(swap-adapter)通常在几秒内就可完成,以太网为3秒,并且这种转换对应用和client来说是透明的,只发生延迟但连接并不中断。网络故障如果发往nodeA上的service和standby网卡上的K-A包全都丢失,而R

6、S232上的K-A仍然存在,那么HACMP断定nodeA仍然正常,是网络发生故障。此时HACMP执行一个network-down的事件的script,通常这个script并不做什么事,只提供一个用户自行定义其行为的接口,用户可以根据自己的网络结构,用户数,是否有替代路径,使用的通讯软件,应用软件等来自行设计网络发生故障后应采取的行为。节点故障如果不仅网络上的K-A全部丢失,而且RS232上的K-A也丢失,那么HACMP断定该节点发生故障,一个node-down事件发生。此时将有资源的接管发生,即放在共享磁盘陈列上的资源

7、将由备份节点接管,接管包括一系列操作:Aquiredisks,VaryonVG,Mountfilesystems,ExportNFSfilesystems,AssumeIPnetworkAddress,Restarthighlyavailableaplications,其中,IP地址接管和应用的重启是由HACMP来实现,而其它是由AIX来完成。当整个节点发生故障时,HACMP将故障节点的serviceIPaddress转移到备份节点上,使网络上的client仍然使用这个IP地址,这个过程称为IP地址接管(IPAT),如

8、上图所示。当一个节点down掉后,如果设置了IP地址接管,网络上的clients会自动连接到接管节点上;同样,如果设置了应用接管,该应用会在接管节点上自动重启,从而使系统能继续对外服务。对于要实现接管的应用,只需在HACMP中把它们设置成"applicationserver",并告诉HACMP启动这个应用的startscript的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。