欢迎来到天天文库
浏览记录
ID:33081125
大小:171.50 KB
页数:14页
时间:2019-02-20
《容错科技rongcuocluster双机容错解决方案》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、杭州容错科技有限公司膅膂蒈羅袄莈莄羄肇膁螃羃腿蒆虿羂芁艿薄羁羁蒄蒀羁肃芇蝿肀膆蒃蚅聿芈芆薁肈羇蒁蒇蚅膀芄蒃蚄节蕿螂蚃羂容错科技rongcuocluster双机容错解决方案一.容错rongcuocluster双机方案简单描述随着计算机技术的发展,信息已成为系统日常活动中十分重要的一个组成部分,同时,由于系统的复杂性和开放性以及应用环境的多样化,也给应用系统的运行带来了许多不确定因素。这些因素也导致对服务器的安全性也提出了更高的要求,基于该平台业务系统的安全,稳定可靠和系统的持续运行成为系统的关键。在一般情况下,当系统不能正常运行时,我
2、们需要用人工的方法进行故障的认定、分析、恢复及测试。这些都需要花费很长的时间。在这段时间内,系统必须停顿下来以等待恢复,从而给企业带来难以估计的经济损失。双机容错是计算机应用系统稳定、可靠、有效、持续运行的重要保证。它通过系统冗余的方法解决计算机应用系统的可靠性问题,并具有安装维护简单、稳定可靠、监测直观等优点。当一台主机出现故障,该软件可及时启动另一台主机接替原主机任务,保证了用户数据的可靠性和系统的持续运行。可以说,在目前信息系统的可用性已成为衡量其资源利用率的最重要的尺度。为了保证系统的不间断,建议采用容错公司的Rongcuo
3、cluster双机容错软件。该软件技术领先,安装管理方便,对系统资源占用极少,能确保您的高可用需求。二.用户需求描述略杭州容错科技有限公司一.Rongcuocluster软硬件配置及网络拓扑图硬件配置:两台可为不同类型的服务器(最好为同类型):IBM/HP/DELL服务器上的网卡(NIC)磁盘阵列柜:SCSI/FC软件配置:操作系统:Windows2000/2003容错系统:Rongcuoclusterforwin2000/2003数据库:Oracle、Sybase、SQLServer等等其它应用软件拓扑图根据客户实际画二.容错科技
4、简介RongcuoCluster集群系统的工作原理RongcuoCluster集群系统软件是由三部分组成,这三部分协同工作,共同完成主机系统的备援工作。RongcuoCluster软件在启动时,首先读取集群系统的配置文件,在该文件中描述集群系统中各节点的网络信息,硬件描述以及任务的定义等参数。集群核心程序根据集群的配置信息,进行集群系统的状态重组。根据当前的网络状态和集群参数,对节点中的服务器进行调整,建立集群的初始状态。在节点初始状态建立起来后,根据规则网络管理模块向管理模块提交各节点的网络状态,管理模块根据各节点的网络状态和集群
5、中对资源的定义,对集群中的各节点进行网络资源分配,使集群中的某个节点获得对外提供网络服务的资源。杭州容错科技有限公司同时启动节点监控功能,对集群中的节点进行网络状态监控,保持网络状态的健康。当集群管理模块对网络资源进行分配后,通过任务管理模块对集群中的任务进行分配,根据集群网络资源的分配情况,将与该网络资源相依存的任务分配给已获得对外提供网络服务的节点。集群任务启动后,该模块启动任务监控功能,对所启动任务的关键进程进行监控。保障对外提供服务的资源健康。当以上资源建立起来后,集群系统进入正常运行状态。RongcuoCluster高可用
6、集群系统,在进入正常运行状态后,通过专用的通讯链路和集群中的其它节点进行通讯,传输各节点的状态信息,使各节点的核心管理模块获得整个集群节点的实时状态。当系统中有节点故障时,集群管理模块根据集群当前的状态和该故障节点在集群中的角色做出集群系统是否重组。当该节点为生产机时,集群系统会自动将属于该节点的资源和任务移交到下一个备用节点。保证该业务正常运行。如果该节点为备份服务器,则需要通知整个集群对备援状态进行调整,将该故障节点从备援设备表中删除。使备援记录中不再有该故障节点的记录。直到该节点修复后重新在线,集群软件自动进入集群中作为备援节
7、点角色。RongcuoCluster集群系统的监控原理当集群系统正常运行后,RongcuoCluster高可用集群系统进入系统监控状态。在监控状态下具有网络状态检测、应用程序检测、集群软件自身状态检测和存储子系统检测。在该状态中主要对以下资源进行监控:网络状态监控在集群运行中,RongcuoCluster集群软件的网络管理模块对整个网络中的网络资源进行实时监控,获取整个网络的运行状态。如果监控到集群中有节点失效时,将该节点的网络状态通知到Rongcuo杭州容错科技有限公司Cluster的管理模块,管理模块根据当前的网络状态和该节点在
8、整个集群中的角色(生产机或备援机),通知整个集群进行状态重组。如果该节点为生产机,则管理模块通知集群中的下一个备援服务器进行任务接管。从集群中剔出该故障服务器。对整个集群重新分配规则。如果为备援机,则管理模块通知整个集群节点进行规则调
此文档下载收益归作者所有