欢迎来到天天文库
浏览记录
ID:51469782
大小:21.50 KB
页数:4页
时间:2020-03-25
《计算机系统可靠性.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、计算机系统高可靠性研究引言:随着计算机应用水平的不断提高,计算机的依赖已经成为社会的必然。计算机的依赖即对数据的依赖,数据已成为社会文明赖以维持的重要条件。不论是在政府机关企事业单位使用的现代办公系统中,还是在保证企业正常生产的大型集散控制系统中,抑或是在代表现代制造业最新水平的柔性制造系统或计算机集成制造系统中,如何保障数据的高可靠、持续访问是我们计算机应用者必须面对的主要问题。以计算机应用和数据为中心的理论为依据,建立计算机应用系统高可靠理论与应用推广技术,保障计算机应用系统的数据高可用,避免数据灾难对社会正常秩序的
2、严重破坏,是计算机应用高可靠性研究的主要内容,该研究具有重大的意义。具体来说包括:海量数据存储系统,数据处理通道高可靠性,数据传输通道高可靠性等。系统可靠性的定义:在特定时间内和特定条件下系统正常工作的相应程度,即(degreeofsuitability)。系统的可用性(availability),即利用率。可用性的平均值即平均利用率,其计算方法为:A=MTBF/(MTBF+MTTR)其中:MTBF(MeanTimeBetweenFailures),故障间隔平均时间;MTTR(MeanTimeToRepair),系统平均
3、修复时间。当前主要容错技术:提高计算机系统可靠性主要有两种方法:避错和容错。所谓避错就是采取各种可能的技术措施避免计算机在使用过程中发生错误;所谓容错就是在系统运行过程中允许某些环节发生某些错误,但是计算机给出的最终结果中不包括由于上述环节中发生的错误所造成影响。1.避错技术。其实就是追求一种完美性。要求组成系统的各个部件、器件具有高可靠性4不允许出错,或者出错率降至最低。1.1硬件的可靠性与完美性指元器件的完美性、部件的完美性、整机与系统的完美性。例如:电路:规范设计、电路结构、时序与竞争元器件:制造、筛选、老化、容差
4、、寿命部件:PCB板、布局、位置、结构、布线、焊接、安装、散热、机械性能、频率整机:整体一致、结构合理、干扰屏蔽环境:布局、强弱电干扰、静电1.2软件的可靠性与完美性指软件的正确性、可用性、完美性、兼容性。1.容错技术即在一定程度上容忍故障的技术。容错系统,采用容错技术的系统。当系统因某种原因出错或者失效,系统能够继续工作,程序能够继续运行,不会因计算机故障而中止或被修改,执行结果也不包含系统中故障引起的差错。容错技术也称为故障掩盖技术(faultmasking)。冗余技术是容错技术的重要结构,它以增加资源的办法换取可靠
5、性。由于资源的不同,冗余技术分为硬件冗余、软件冗余、时间冗余和信息冗余。资源与成本按线性增加,而故障概率则可按对数规律下降。冗余要消耗资源,应当在可靠性与资源消耗之间进行权衡和折衷。2.1硬件容错技术1)系统级容错多种系统容错后备模式l双机双工热备份(MutualBackup)两机同时运行,分不同作业,各自资源负载,故障、接管、修复、交还。l主从热备份(Master/Slave)主从式(M/S),M运行,S后备,M故障,S接管并升级为M,原M修复后作为Sl热备份(Hot-Standby)M运行,S后备,M故障,S接管作M
6、,原M修复,S归还M。2)部件级容错l存储子系统(最容易发生故障的地方)4Ø磁盘镜像:将相同的数据分别写入两个磁盘Ø磁盘双联:为镜像磁盘增加了一个I/O控制器,形成磁盘双联,使总线争用得到改善。ØRAID(独立磁盘冗余阵列)简单地解释,就是将N台硬盘通过RAIDController(分Hardware,Software)结合成虚拟单台大容量的硬盘使用。磁盘阵列中针对不同的应用使用的不同技术,称为RAIDlevel,而每一level都代表着不同技术,目前业界公认的标准是RAID0~RAID5。用哪个level视用户的操作环
7、境和应用而定。RAID的采用为存储系统(或者服务器的内置存储)带来巨大利益,其中提高传输速率和提供容错功能是最大的优点。l电源:采用双电源,DC冗余,AC、DC全冗余。lI/O卡:双网卡。lPCI总线:三重对等PCI技术。lCPU:多CPU容错系统。2.2软件冗错技术这里所讨论的软件容错主要是对计算机应用软件科技人员为某一个特定的工程设计和开发的应使用软件而言。目前实现软件设计的冗余通常都采用重版本程序设计法,这如同硬件静态容错一样,是一种静态屏蔽软件可能造成错误的技术。设计思想是用N个具有相同功能的程序同时或先后执行某
8、项计算,结果通过多数表决来选择。表决程序是N重本程序设计结构的关键。以N重版本程序设计的方法来实现软件设计的冗余是保证软件可靠性同时也是提高整个系统可靠性的最强有力的措施,但是这种技术措施的采用又反过来要求增加为其运行所需的硬件资源,从而加大了系统的成本和硬件设计的复杂性$另一方面也增加了系统在时间上的开销,从而使系
此文档下载收益归作者所有