欢迎来到天天文库
浏览记录
ID:37836012
大小:818.78 KB
页数:47页
时间:2019-06-01
《故障注入测试方法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、故障注入测试放射研发测试部www.landwind.com.cn2故障注入的概念故障注入提出于70年代初期,之后一直被工业界用来对容错系统的设计进行验证。80年代中期,故障注入技术逐渐开始被高校和研究部门所采用。进入90年代后,该技术越来越引起研究人员和工程设计者的重视,对故障注入的研究与应用也随之深入和广泛。故障注入的概念:故障注入是指按照选定的故障模型,用人工的方法有意识地产生故障并施加于特定的目标系统中,以加速该系统的错误和失效的发生,同时采集系统对所注入故障的反应信息,并对回收信息进行分析,从而提供有关结果的过程。3故障注入的分类按所注入的故障类型分:软件故障注
2、入、硬件故障注入按系统故障的抽象级别:可分为晶体管开关级、逻辑门级、芯片管脚级、微指令和宏指令级、系统级、应用级的故障注入等;4底层驱动及相关硬件故障插入测试寄存器故障插入测试:[概念]此处寄存器故障是指寄存器值与期望值不符的状态。[测试目的]模拟寄存器值被异常修改后系统的运行规律是否符合用户需求。[故障产生原因](1)软件发生错误,例如越界(2)电源低压波动(3)芯片内部故障[故障可能产生的后果](1)业务局部中断(2)业务没有中断但不正确(3)扩散为系统级故障[测试时的故障产生方法]修改寄存器值。[测试步骤](1)增加修改寄存器值的命令(2)运行程序,在程序正常运行
3、时通过命令修改寄存器值(3)观察系统运行情况(4)重复步骤2和3,对主要寄存器进行故障插入测试[测试的期望结果]系统能够检测到芯片寄存器或相关业务异常,并能正确倒换到备用单板或对芯片进行重新初始化,重新初始化后业务正常。5底层驱动及相关硬件故障插入测试误码测试[概念]所谓误码就是当发送端发送“1”码元时,在接收端收到的却是“0”码元,反之亦然。这种收发信码的不一致就称为误码。[测试目的]测试芯片及其驱动程序在发生误码情况下是否具有容错能力。[故障产生原因](1)收发芯片异常(2)线路干扰(3)时钟不稳定[故障可能产生的后果](1)误码率太高,使业务局部中断(2)业务没有
4、中断但误码过多(3)扩散为系统级故障[测试时的故障产生方法]需要专门的测试仪器(比如传输用的SDH测试仪)[测试步骤](1)将测试仪器连接到单板(2)利用仪表进行各种误码的插入测试(分为短时误码插入与长时间误码插入:长时间最好能达到24小时),观察此过程中产生的现象是否和设计目的有冲突,例如如果设计为线路有误码时进行断链、倒换,则检查是否能倒换,如果设计为有误码时链路要保持连接,则检查此时链路是否能保持连接。(3)停止误码插入,检查是否能恢复到误码前的状态。[测试的期望结果]线路出现误码,单板能够正确上报,告警抑制关系正确,停止误码插入后,单板能够恢复正常,停止上报误码
5、。6底层驱动及相关硬件故障插入测试晶振失效测试[概念]晶振失效包括晶振短路、开路、频率漂移,晶振失效测试是指通过模拟晶振失效来观察系统在晶振发生失效情况下的软件运行情况是否符合需求的测试。[测试目的]测试晶振失效后系统的运行规律是否符合用户需求。[故障产生原因]晶振老化失效。[故障可能产生的后果](1)业务中断(2)误码(3)扩散为系统级故障[测试时的故障产生方法]用镊子轻触晶振的两个引脚,使晶振输出短路到地或短路到电源,当然,这种方法产生的信号质量差,如果要得到好的信号质量,则要开发专门的测试用具了。[测试步骤](1)启动程序,使软件正常运行,加入业务数据流,(2)用
6、镊子轻触晶振的两个引脚,使晶振输出短路到地,检查系统的运行状态,在晶振短路的条件下运行一段时间后,再检查系统的运行状态,(3)用镊子轻触晶振的两个引脚,使晶振输出短路到电源,检查系统的运行状态,在晶振短路的条件下运行一段时间后,再检查系统的运行状态,(4)如果条件允许,进行晶振开路测试,检查系统的运行状态。(5)对其它晶振重复步骤1~4。[测试的期望结果]对于重要业务,能立刻倒换到备用设备上去。对于所有业务,在晶振失效状态下,故障不应扩散到其它单板或模块。7底层驱动及相关硬件故障插入测试时钟频率及相位偏移测试[[测试目的]测试时钟发生漂移时系统的运行状态。[故障产生原因
7、](1)时钟源误差超过范围(2)锁相电路或相关模块故障。[故障可能产生的后果](1)误码(2)指针调整(3)业务中断[测试时的故障产生方法](1)可使用时钟拉偏板或相关仪器测试。(2)修改数字锁相环中的DA值(数字环)。(3)断开反馈环。(4)调节压控电压。(5)切换到另外一种频率的时钟。[测试步骤](1)搭好测试工具,运行程序,并加入一定的业务量。(2)在程序正常运行时,提高时钟频率,观察系统的运行状态,缓慢增加提高量,观察系统的运行状态。(3)时钟频率恢复到初始值,检查系统是否恢复正常。(4)在程序正常运行时,降低时钟频率,观察系统的
此文档下载收益归作者所有