基于三次检测模式的故障检测算法研究

基于三次检测模式的故障检测算法研究

ID:21874784

大小:56.50 KB

页数:8页

时间:2018-10-25

基于三次检测模式的故障检测算法研究_第1页
基于三次检测模式的故障检测算法研究_第2页
基于三次检测模式的故障检测算法研究_第3页
基于三次检测模式的故障检测算法研究_第4页
基于三次检测模式的故障检测算法研究_第5页
资源描述:

《基于三次检测模式的故障检测算法研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于三次检测模式的故障检测算法研究:本文在传统故障算法的基础上,提出了一种基于三次检测模式的故障检测算法。利用平滑历史检测点逼近检测时间;根据历史误判情况分析,动态调整二次检测时间;通过在定时器超时后向被检测点发送咨询消息的方式减少由于X络丢包等情况使得心跳消息不可达而造成的误判。通过三次检测模式,提高了异构分布式X络环境下失效检测算法的自适应性。通过对比实验,验证了在分布式系统实现检测应用中,利用三次检测模式的故障检测算法能有效提高检测算法的准确性和自适应性。  关键词:异构分布式系统;故障检测;自适应性;三次检测模式  1引言  随着计算机和X络技术的

2、飞速发展,分布式系统已经渗入到许多领域。其中一些关键领域,如作战指挥控制、航空航天等,对分布式系统的可靠性提出了更高的要求,容错技术是提高系统可靠性的一种有效手段。容错技术涉及到故障检测以及故障恢复等技术,而故障检测是提高系统可靠性的基础。为了更好地权衡故障检测算法的性能,Chandra和Toueg提出了故障检测器的两个基本属性:完整性(pleteness)和精确性(Accuracy)[1]。其中,完整性刻画了故障检测器怀疑一个出现故障的处理器的能力,而精确性则体现了故障检测器不会去怀疑一个工作正常的处理器的能力。完整性和精确性是衡量失效检测算法优劣的关键

3、指标。  目前针对故障检测算法的研究大都是基于超时机制的。检测点与被检测点之间周期性地发送测试消息,并启动超时定时器作为下一个周期的检测点。根据定时器超时前是否收到检测消息判定被检测点是否发生故障。因此超时时限的设定是影响给故障检测算法的关键因素。传统故障检测算法并没有考虑异构分布式环境的多变性,超时时限的设定过于简单。为了提高故障检测算法的自适应性,本文提出了一种利用三次检测模式的故障检测算法。  2故障检测算法  故障检测算法是分布式系统容错技术的基础,Metze[2]等人在1967年率先提出了基于图理论模型的故障检测分析方法,以后的故障检测器的分析大

4、都在此模型基础上进行的。  2.1故障检测机制  目前的故障检测算法大都是基于超时机制的。超时机制的实现方式有两种。一种是基于请求—应答模式的;一种是基于心跳模式的。图2—1给出了基于请求—应答模式的简单示意图。其中,节点p需要了解q的状态,节点p每个T时间向节点q送请求,并启动定时器T,如果节点p在T时间内没有收到节点q的应答信息,则节点p就认定节点q出现故障。该模式是通过检测节点向被检测节点发送状态咨询测试消息的方式完成状态检测的。  图2—2给出了基于心跳模式超时机制的简单示意图。  其中,节点p为监控节点,节点q为被监控节点。被监控节点p周期性地向

5、监控节点q发送自己的心跳消息,监控节点p如果在时间间隔T内没有收到节点q的心跳消息,则判定节点q出现故障。该模式是通过被检测节点周期性地向检测节点发送自己的状态信息来通告自己仍然存活。  2.2传统故障检测算法  假定系统中存在两个节点进程p和q,进程p负责监控进程q的状态。考虑采用请求—应答模式,传统故障检测算法的基本思想是:进程p以固定的时间间隔周期性地向进程q发送咨询信息,询问进程q的状态,同时启动超时定时器。进程q收到咨询信息后会向进程p发送应答信息,告之自己仍然存活。进程p根据在定时器超时之前能否收到进程q的应答消息来判定进程q是否存活。如果判定

6、未存活,则停止发送咨询信息,并怀疑进程q。  由于异构分布式X络环境的多变性,很可能会造成两个节点进程之间X络延迟或丢包等现象。因此,利用传统故障检测算法实现故障检测存在以下缺陷:  1)固定超时时限。根据分布式系统节点之间消息传递时延的差异,分布式系统可以分为:同步系统、异步系统和部分同步系统。同步系统中节点之间传递消息的时延存在一个固定的上限,因此在同步模型中把超时时限设定为固定的上限可以有效地检测节点是否失效。异构系统中节点之间的通信是不同步的,因此不存在一个真正有效的固定时限。而Chandra和Toueg已经证明了在绝对异步的系统中设计一个可靠的故

7、障检测器是不可能的。部分同步系统中节点之间消息传递的延时存在上限但是不固定且是未知的,在该模型下,采用固定超时时限的方式也是不合理的。由于绝对同步的系统式理想化的,因此传统故障检测算法采用的固:本文在传统故障算法的基础上,提出了一种基于三次检测模式的故障检测算法。利用平滑历史检测点逼近检测时间;根据历史误判情况分析,动态调整二次检测时间;通过在定时器超时后向被检测点发送咨询消息的方式减少由于X络丢包等情况使得心跳消息不可达而造成的误判。通过三次检测模式,提高了异构分布式X络环境下失效检测算法的自适应性。通过对比实验,验证了在分布式系统实现检测应用中,利用三

8、次检测模式的故障检测算法能有效提高检测算法的准确性和自适应性。  

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。