实时高可靠测控集群故障与恢复技术研究

实时高可靠测控集群故障与恢复技术研究

ID:46626759

大小:692.41 KB

页数:4页

时间:2019-11-26

实时高可靠测控集群故障与恢复技术研究_第1页
实时高可靠测控集群故障与恢复技术研究_第2页
实时高可靠测控集群故障与恢复技术研究_第3页
实时高可靠测控集群故障与恢复技术研究_第4页
资源描述:

《实时高可靠测控集群故障与恢复技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、2014年第6期导弹与航天运载技术No.62014总第336期MISSILESANDSPACEVEHICLESSumNo.336文章编号:1004—7182(2014)06·0057.04DOI..10.7654/j.issn.1004—7182.20140615实时高可靠测控集群故障与恢复技术研究李连登,童艳(中国人民解放军91550部队,大连,116021)摘要:针对实时测控信息类型复杂、信息处理和控制方法多样,对实时性和可靠性要求高等特点,构建一种基于集群计算平台的实时、高可用测控系统;采用分布式集群管理控制模式,克服集中式

2、集群管理可能会出现系统瓶颈问题;构建l主1备热备节点,缩短任务迁移和故障切换时间,并设计集群故障和恢复方法,提高系统的实时性和可靠性。关键词:实时性;测控集群;1主1备;任务迁移与恢复中图分类号:TP311文献标识码:AResearchonFailureandRecoveryTechnologyforReal-timeHighReliabilityMeasurementandControlClusterLiLian—deng,TongYan(PLAUnit91550,Dalian,116021)Abstract:Withviewt

3、othediversityoftheinformationandinformationprocessingandcontrolmethods,alongwiththehighdemandforreliabilityandreal—timeproperty,etc.,akindofreal—time,highlyavailablemeasurementandcontrolsystemisestablishedonthebasisofclustercomputingplatform;inordertoovercomethebottle

4、neckproblemsofthesystemcausedbycentralizedclustermanagement,adistributedclustermanagementcontrolmodeisadopted;inaddition,onemasteroneslavehotstandbynodeisbuilttoshortenthetaskmigrationandfailovertime.Afailureandrecoverymethodisdesignedtoimprovethereliabilityandreal·ti

5、mepropertyofthesystem.KeyWords:Real-time;Measurementandcontrolcluster;Onemasteroneslave;Taskmigrationandrecovery0引言为满足高速测量数据流的实时采集、并发控制、并行处理,以及实时测控系统的强实时性、高可靠性和可扩展性需求11’21,构建了基于集群计算平台的强实时、高性能、高可靠性和大容量的实时测控系统,简称实时高可用测控集群系统。如何实现系统故障的迁移与恢复是设计实时高可用测控集群系统必须解决的关键技术问题。目前,主要通

6、过管理控制节点对集群节点实施集中式管理,或采用两套集群系统构成双工的工作模式【3“】来解决集群系统实时性和可靠性问题,在实际应用中,集中式集群管理可能会出现系统瓶颈问题,而集群双工工作模式建设成本高,故障迁移与恢复的响应时间较长。为了解决上述问题,本文采用分布式集群管理控制模式,构建了“1主l备”热备节点工作模式,以缩短任务迁移和故障切换时间,提高系统的实时性和可靠性。1系统体系结构设计为了有效地解决单一入口点、单一文件层次、单点管理和控制等技术难点,集群各节点驻留相同的应用软件和系统软件,使其具有单一系统映像功能。同时,为了降低

7、任务分配、消息传递、任务迁移等关键技术实现复杂度,集群系统各节点应运行在相同的软硬件平台上。1.1设计思想在系统运行时,集群中任意任务程序始终处于“1主l备”热备份状态,即除了运行该任务程序进行任务处理的节点外,另一节点同时运行该程序,启动任务处理(但不输出处理结果),在此过程中,构成“1主1各”的节点相互监视状态,发现节点故障后立即收稿日期:2013.09—23;修回日期:2014—11-03基金项目:军内专项建设基金作者简介:李连登(1977,),男,博士,高级工程师,主要研究方向为指挥控制58导弹与航天运载技术2014年执行

8、任务迁移和恢复,以缩短任务迁移和恢复的响应时间,提高系统的实时性。为了克服集中式集群管理可能会出现系统瓶颈的问题,不设置独立的集群管理控制节点。集群所有节点地位一样,构成一个闭环,连接到任何一个集群节点,只要拥有令牌均可对集群进行管理;同时,拥有令

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。