计算机系统可靠性

计算机系统可靠性

ID:39833463

大小:506.00 KB

页数:41页

时间:2019-07-12

计算机系统可靠性_第1页
计算机系统可靠性_第2页
计算机系统可靠性_第3页
计算机系统可靠性_第4页
计算机系统可靠性_第5页
资源描述:

《计算机系统可靠性》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第二章计算机系统的可靠性系统可靠性(冗余、容错、专用)系统可用性(可正常运行、故障可恢复)系统部件一致性(配置合理)网络互连性(连通和隔离的矛盾,布线)环境安全性(配电、接地、防护)检查验收:按照标准、规范、合同和协议系统可靠性的定义:在特定时间内和特定条件下系统正常工作的相应程度,即(degreeofsuitability)。可靠性的测量方式:系统的可用性(availability),即利用率。可用性的平均值即平均利用率,其计算方法为:A=MTBF/(MTBF+MTTR)MTBF(MeanTimeBetwe

2、enFailures)故障间隔平均时间MTTR(MeanTimeToRepair)系统平均修复时间第一节计算机系统的可靠性与容错性系统可靠性的获得可靠性┌──────┴──────┐容错性完美性(faulttolerance)(perfection)│┌───┴───┐冗余技术─┬硬件冗余完美硬件完美软件(redundancy)├软件冗余├整机完美性│

3、├时间冗余├部件完美性可信软件

4、└信息冗余└器件完美性

5、

6、静态冗余(部件冗余)可用硬件动态重组

7、--被动重组(后备stand-by)

8、--主动重组(优美降级g

9、racefuldegradation)完美性追求一种避错技术,即避免出错。要求组成系统的各个部件、器件具有高可靠性不允许出错,或者出错率降至最低。㈠硬件的可靠性与完美性电路:规范设计、电路结构、时序与竞争元器件:制造、筛选、老化、容差、寿命部件:PCB板、布局、位置、结构、布线、焊接、安装、散热、机械性能、频率整机:整体一致、结构合理、干扰屏蔽环境:布局、强弱电干扰、静电完美性与避错技术完美性与避错技术(续)㈡软件的可靠性与完美性1)正确性:软件有正确性吗?软件完美吗?正确性证明的范畴。2)可用性:软件在一定

10、的环境条件和应用条件下可以正常运行,功能正常。3)兼容性:软件对运行环境、运行平台和运行条件的适应性。4)可信性:对用户来说,所使用的软件值得信赖,对软件产生的心理性依赖。(三)软件的可靠性与硬件的可靠性的区别(共9点)1.最明显的是硬件有老化损耗现象;软件不发生变化,没有磨损现象,有陈旧落后的问题。2.硬件可靠性的决定因素是时间,受设计、生产、运用的所有过程影响,软件可靠性的决定因素是与输入数据有关的软件差错,更多地决定于人。3.硬件的纠错维护可通过修复或更换失效的系统重新恢复功能,软件只有通过重设计。4.

11、对硬件可采用预防性维护技术预防故障,采用断开失效部件的办法诊断故障,而软件则不能采用这些技术。5.事先估计可靠性测试和可靠性的逐步增长等技术对软件和硬件有不同的意义。6.为提高硬件可靠性可采用冗余技术,而同一软件的冗余不能提高可靠性。7.硬件可靠性检验方法已建立,并已标准化且有一整套完整的理论,而软件可靠性验证方法仍未建立,更没有完整的理论体系。8.硬件可靠性已有成熟的产品市场,而软件产品市场还很新。9.软件错误是永恒的,可重现的,而一些瞬间的硬件错误可能会被误认为是软件错误。总的说来,软件可靠性比硬件可靠性

12、更难保证,即使是美国宇航局的软件系统,其可靠性仍比硬件可靠性低一个数量级。㈠容错系统的概念容错技术:在一定程度上容忍故障的技术。容错系统:采用容错技术的系统当系统因某种原因出错或者失效,系统能够继续工作,程序能够继续运行,不会因计算机故障而中止或被修改,执行结构也不包含系统中故障引起的差错。容错技术也称为故障掩盖技术(faultmasking)。容错性与容错技术容错性与容错技术(续)冗余技术是容错技术的重要结构,它以增加资源的办法换取可靠性。由于资源的不同,冗余技术分为硬件冗余、软件冗余、时间冗余和信息冗余。

13、资源与成本按线性增加,而故障概率则可按对数规律下降。冗余要消耗资源,应当在可靠性与资源消耗之间进行权衡和折衷。双CPU容错系统当一个CPU板出现故障时,另一个CPU保持继续运行。这个过程对用户是透明的,系统没有受到丝毫影响,更不会引起交易的丢失,充分保证数据的一致性和完整性。系统的容错结构能够提供系统连续运行的能力,任何单点故障不会引起系统停机,系统提供在线的维护诊断工具可在应用继续运转的情况下修复单点故障。冗余类型:1.硬件冗余:增加线路、设备、部件,形成备份。2.软件冗余:增加程序,一个程序分别用几种途径

14、编写,按一定方式执行,分段或多种表决。3.时间冗余:指令重复执行,程序回卷技术。4.信息冗余:增加信息数据位数,检错、纠错。㈡容错系统工作方式1.自动侦测(Auto-Detect)通过专用的冗余侦测线路和软件判断系统运行情况,发现可能的错误和故障,进行严谨的判断与分析。确认主机出错后,启动后备系统。侦测程序需要检查主机硬件(处理器与外设部件)、主机网络、操作系统、数据库、重要应用程序、外部存储子系统

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。