软件的容错技术初探

软件的容错技术初探

ID:11889516

大小:232.00 KB

页数:22页

时间:2018-07-14

软件的容错技术初探_第1页
软件的容错技术初探_第2页
软件的容错技术初探_第3页
软件的容错技术初探_第4页
软件的容错技术初探_第5页
资源描述:

《软件的容错技术初探》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、目录○、引言7一、系统故障的表现形式及其错误的根源7㈠故障、失效和错误的概念7㈡故障的分类8㈢错误的根源8二、软件容错技术9㈠容错技术的内容9㈡系统容错策略的分类10㈢容错技术的实现101.时间冗余102.信息冗余11三、软件的一般容错设计举例14㈠中断中的资源冲突及其预防14㈡状态转移的条件审查16㈢重要模块的安全措施16四、总结16致谢17参考文献1822软件的容错技术初探摘要:在本文中,将着重讨论软件的容错技术。容错技术能容忍错误又不致使系统无法工作,也就是说是在软硬件错误已经发生的情况下使得系统仍能正常工作的技术。软件理论告诉我们,一个微机系统的软件是

2、不可能没有错误的,更不要说没有不足之处了。软件的容错设计可以帮助人们尽可能减少错误,使系统由于软件问题而出错的概率降低到完全可以接受的程度,使系统在出错情况下仍可正常工作。另外,软件容错对硬件原因引起的错误解决也是有作用的,大量的硬件容错技术应用往往和软件容错是相结合不可分的,比如数据备份没有硬件支持就不行,软件容错往往比硬件容错更能适应人们对系统的复杂要求。关键词:容错,冗余,校验○、引言随着现代工业技术的发展和计算机的普及,应用对计算机可靠性的要求愈来愈高。可以说,在任何时刻,人们都没有忘记计算机的可靠性问题。电子设备的广泛应用,必然导致他们在其周围空间产

3、生的电磁场电平的不断增加,因此电磁干扰(EMI)和电磁兼容(EMC)问题越来越引起人们的重视。现如今,容错技术对很多用户来说,早已不再陌生。建立在冗余技术基础之上的容错技术,在解决单点故障、缩短故障恢复时间、降低人为错误、减少部件和软件版本不兼容等方面相对于集群服务器都显示出了其强大的优势,并逐渐成为服务器市场的新亮点。一、系统故障的表现形式及其错误的根源研究容错技术的目的,在于使系统在出错情况下仍可正常工作。㈠故障、失效和错误的概念人们常说的“出错”,严格地讲还不够准确。所谓“错”实际上是故障、失效和错误的概念的统称。对于研究容错技术来讲,需要把三者区分开来

4、。失效(failure)是指硬件物理特性异变。例如,集成电路内部硅片表面的龟裂、连线短路或断路、漏电、电路输出的电平由正常变到非正常值等。故障(fault)是指硬件或软件的错误状态,是失效在逻辑上的等效,如一个电路的逻辑值由“1”状态错成“0”状态,软件判断的“是”错成“否”等,都被称为故障。一个故障可以用种类、值、影响范围和发生时间来描述。错误(error)是指程序或数据结构中的故障表现形式,是故障和失效所造成的后果,如运算结果由正变成负,或是一个完整的值,都称为错误。㈡故障的分类22若按逻辑性来分,故障可分为逻辑故障和非逻辑故障两种。造成逻辑值发生变化的故

5、障称为逻辑故障,造成像时钟(clock)或电源出错等错误的故障称为非逻辑故障。按时间划分,故障可分为以下三种:1永久性故障(permanent)在英语文献中的“hardfault”常表示这类故障。永久故障是指永远持续下去直至修复为止的故障。对硬件来说,永久性故障意味着不可逆的物理变异,如一个电路环了、线断了等。对软件来说,这类故障也是一个不可自动恢复的错误状态。2间歇性故障(intermittent)这种故障是短暂的,但却是断续的,它既有其偶然性,又有其不定期的重复性。如一个处于临界状态的电路输出时好时坏,而一个虚焊点就会引起这样的故障。3偶然性故障(tran

6、sient)这种故障在英语中有时用“softfault”表示。故障的出现是暂时的,且可能是非重复性的。常常由于环境的变化、电源方面的干扰、元器件性能的波动、软件的随机变化、电磁干扰等因素而引起。这样的故障有可能仅出现一次,或很长时间出现一次,但却可能造成数据错误,甚至系统瘫痪。针对不同故障可采取不同的容错方法。如对于永久性故障,可以调用诊断程序进行故障定位,然后采取纠错措施;对于间歇性故障,因其持续时间很短,因而无法使用诊断程序,但它又有重复性,又提供了一个进行错误断判的机会,可以通过更换硬件或软件等途径来达到修复的目的;要纠正由于环境等因素造成的偶然性故障,

7、则是一件十分困难的事,这种故障一闪而过,连故障来自哪个方面都难以确定,但后果已经造成,只能靠改善环境条件等努力来减少这类故障。因此,如何消除间歇性故障和偶然性故障的影响,将是容错技术研究的重点课题。㈢错误的根源错误是失效和故障所引起的后果,可以归纳为图1所表示的关系。图1错误是失误和故障所引起的后果22二、软件容错技术㈠容错技术的内容容错技术能达到对故障的“容忍”,但并非是“无视”故障的存在。它首先能自动地适时地检测并诊断出系统的故障,然后采取对故障的控制或处理的策略。根据错误的不同情况,一个容错系统可能经历多达10个阶段:1故障限制当故障出现时,希望限制其影

8、响范围。故障限制是把故障效应的传播限制

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。