资源描述:
《3.1 假设检验》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第一节假设检验的提出例1某企业生产一种零件,以往的资料显示零件平均长度为4cm,标准差为0.1cm。工艺改革后,抽查100个零件发现其平均长度为3.94cm。问:工艺改革后零件长度是否发生了显著变化?例2某厂有一日共生产了200件产品,按国家标准,次品率不得超过3%才能出厂.现从该批产品中随机抽取10件,发现其中有2件次品,问:这批产品能否出厂?这两个例子中都是要对某种“陈述”做出判断:例1要判明工艺改革后零件平均长度是否仍为4cm;例2要判明该批产品的次品率是否低于3%。进行这种判断的信息来自所抽取的样本要回答此类问题
2、,有必要引入假设检验!假设检验参数假设检验非参数假设检验总体分布已知,检验关于未知参数的某个假设总体分布未知时的假设检验问题所谓假设检验,就是事先对总体参数或总体分布形式作出一个假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定是否接受或否定原假设.让我们先看一个例子.这一讲我们讨论对参数的假设检验.例8.1某厂生产干电池,根据长期的资料知道,干电池的寿命服从正态分布,且标准差小时.规定要求平均寿命(即均值)小时.今对一批产品抽查了10个样品,测得寿命的数据如下(小时):20120
3、8212197205209194207199206问这批干电池的寿命是否是200小时?设干电池的寿命为X,,现在的问题是吗?它的对立假设是:称H1为备选假设(或对立假设).H1:在实际工作中,往往把不轻易否定的命题作为原假设.H0:(=200)记H0就是我们要检验的内容,称为原假设或零假设那么,如何判断原假设H0是否成立呢?较大、较小是一个相对的概念,合理的界限在何处?应由什么原则来确定?由于是正态分布的期望值,它的估计量是样本均值,因此可以根据与的差距来判断H0是否成立.-
4、
5、较小时,可以认为H0是成立的;当-
6、
7、生产
8、已不正常.当较大时,应认为H0不成立,即-
9、
10、问题是:如何给出这个量的界限?这里用到人们在实践中普遍采用的一个原则:小概率事件在一次试验中基本上不会发生.现在回到我们前面干电池的例中:在提出原假设H0后,如何作出接受和拒绝H0的结论呢?在假设检验中,我们称这个小概率为显著性水平,用表示.常取的选择要根据实际情况而定。提出假设选检验统计量~N(0,1)H0:=200H1:≠200由于已知,它能衡量差异大小且分布已知.对给定的显著性水平,可以在N(0,1)表中查到分位点的值,使故我们可以取拒绝域为:也就是说,“”是一个小概率
11、事件.W:如果由样本值算得该统计量的实测值落入区域W,则拒绝H0;否则,不能拒绝H0.不否定H0并不是肯定H0一定对,而只是说差异还不够显著,还没有达到足以否定H0的程度.所以假设检验又叫“显著性检验”如果显著性水平取得很小,则拒绝域也会比较小.其产生的后果是:H0难于被拒绝.如果在很小的情况下H0仍被拒绝了,则说明实际情况很可能与之有显著差异.基于这个理由,人们常把时拒绝H0称为是显著的,而把在时拒绝H0称为是高度显著的.在上面的例子的叙述中,我们已经初步介绍了假设检验的基本思想和方法.下面,我们再结合另一个例子,进一
12、步说明假设检验的一般步骤.例2某工厂生产的一种螺钉,标准要求长度是32.5毫米.实际生产的产品,其长度X假定服从正态分布未知,现从该厂生产的一批产品中抽取6件,得尺寸数据如下:32.56,29.66,31.64,30.00,31.87,31.03问这批产品是否合格?…分析:这批产品(螺钉长度)的全体组成问题的总体X.现在要检验E(X)是否为32.5.提出原假设和备择假设第一步:已知X~未知.第二步:能衡量差异大小且分布已知取一检验统计量,在H0成立下求出它的分布第三步:即“”是一个小概率事件.小概率事件在一次试验中基本上
13、不会发生.对给定的显著性水平=0.01,查表确定临界值,使得否定域W:
14、t
15、>4.0322故不能拒绝H0.第四步:将样本值代入算出统计量t的实测值,
16、t
17、=2.997<4.0322没有落入拒绝域这并不意味着H0一定对,只是差异还不够显著,不足以否定H0.假设检验会不会犯错误呢?由于作出结论的依据是下述小概率原理小概率事件在一次试验中基本上不会发生.不是一定不发生如果H0成立,但统计量的实测值落入否定域,从而作出否定H0的结论,那就犯了“以真为假”的错误.如果H0不成立,但统计量的实测值未落入否定域,从而没有作出否定H0的
18、结论,即接受了错误的H0,那就犯了“以假为真”的错误.请看下表假设检验的两类错误H0为真实际情况决定拒绝H0接受H0H0不真第一类错误正确正确第二类错误P{拒绝H0
19、H0为真}=,P{接受H0
20、H0不真}=.犯两类错误的概率:显著性水平为犯第一类错误的概率.两类错误是互相关联的,当样本容量固定时,一类错误概率的减少导