欢迎来到天天文库
浏览记录
ID:8970468
大小:52.00 KB
页数:7页
时间:2018-04-13
《linux操作系统硬件稳定性指南》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、Linux操作系统硬件稳定性指南 (转载整合)CPU和内存疑难问题解答 Linux负有盛名的特点之一是其非凡的稳定性。然而,如果您的硬件有缺陷或配置不正确,即使是世界上最稳定的操作系统也不会对您有什么帮助。本文中,DanielRobbins将告诉您如何诊断和修复CPU问题,并告诉您如何测试RAM缺陷。通过学习本文,您将学会确保您的Linux系统达到尽可能好的的稳定性。 在Linux世界中,我们中的许多人已遭受过令人深恶痛绝的硬件问题之苦。许多人曾经配置了一台Linux机器、安装了最喜欢的分发软件、编
2、译并安装了一些附加应用程序并且使各个部件都运行顺利,到最后发现新系统中有一个致命的硬件错误?无论是随机分段错误、数据毁坏、硬锁定、还是丢失数据其结果都是一样的--硬件故障使通常情况下可靠的Linux操作系统几乎无法顺利运行。本文中,我们将深入探讨如何检测CPU和RAM问题--在缺陷部件造成一些严重的破坏之前就允许更换它们。 如果您正遭遇不稳定问题并且猜测该问题与硬件有关,我鼓励您测试CPU和内存以确保它们工作正常。但是,即使您尚未遇到这些问题,执行CPU和内存测试仍不失为一个好主意。在测试CPU和内存中
3、,您可能会检测到硬件问题,它可能会在某个不适当的时候给您带来麻烦,并可能已经造成了数据丢失或让您花了数小时却搜索不到问题的根源。正确地,前瞻性地应用这些技术可帮助您避开这些令人头疼的问题,并且如果系统通过了测试,您即可放心,系统是符合规范的。 CPU问题 如果您有一个非常糟糕的CPU,您的机器可能无法引导Linux或仅运行几分钟便被锁定。由于症状非常明显,所以容易诊断出这种不良状态下的CPU是有缺陷的。但更多的是一些不易检测到的细微的CPU缺陷;一般情况下,不太明显的错误能引起机器无明显原因的不时锁定
4、,或导致某些进程意外死掉。多数CPU不稳定问题可通过“考验”CPU来触发--给CPU分配大量的工作,促使其变热,甚至在可能的情况下使它休眠。让我们看一下压力测试CPU的一些方法。 当听说测试CPU稳定性的最好方法之一是Linux内建的--内核编译,您可能会感到奇怪。gcc编译器是测试一般CPU稳定性的一个很好的工具,内核编译将充分使用gcc。通过在/usr/src/linux目录创建并运行下面的脚本可以对您的机器进行industrial-strength内核编译压力测试: cpubuild脚本
5、 #!/bin/bash makedep while["foo"="foo"] do makeclean make-j2bzImage if[$?-ne0] then echoOUCHOUCHOUCHOUCH exit1 fi done 您将注意到此脚本重复编译内核。原因很简单--一些CPU有断断续续的小故障,使得它们在95%的时间里顺利地编译内核,但又不时地使内核编译崩溃。通常情况下,这是因为在处理器加热到一定温度(在该温度下处理器变得不稳定)之前可能进行了5个或更多内
6、核编译。 在上面的脚本中,注意调整-j选项,使紧跟它的数字等于系统中CPU的数目加1;换句话说,若是单处理器使用"2",双处理器使用"3",依此类推。-j选项告诉make程序行平行编译内核,确保在编译每个源文件后总有至少一个gcc进程准备就绪--确保CPU承受的压力达到最大。如果下午不准备使用Linux机器,请继续运行此脚本并让机器重新编译内核几个小时。 可能的CPU问题 如果脚本持续几个小时运行顺利,祝贺您!您的CPU已经通过了第一个测试。但是,上述脚本可能会意外死掉。如何知道是CPU有问题而不是
7、其它的问题呢?如果gcc发出与下面类似的错误,则很有可能是CPU有问题: gcc:Internalcompilererror:programcc1gotfatalsignal11 这时,CPU有三种可能的状态: 如果您输入"makebzImage"重新进行内核编译,并且编译器死在同一文件上,请继续一遍遍输入"makebzImage"。如果试了大约十次之后,编译进程继续死在此特定文件上,那么问题很可能是由(很少)gcc编译器错误引起的,该错误是由此特定的源文件而不是有问题的CPU触发的。但
8、是,这些天gcc很稳定,那么这种情况发生的可能性很小。 如果您输入"makebzImage"重新进行内核编译,并且稍后得到另一个信号11,那么您的CPU很可能快要无法使用了。 如果您输入"makebzImage"重新进行内核编译并且内核编译成功,那也不意味着您的CPU是好的。通常这意味着仅当CPU升到一定的温度以上(CPU使用超过一定时间后会变热,可能进行过几次内核编译后能达到此临界点),CPU故障才不时地显露出来。 抢
此文档下载收益归作者所有