第五章 统计估计与假设检验

第五章 统计估计与假设检验

ID:21957935

大小:244.00 KB

页数:16页

时间:2018-10-25

第五章 统计估计与假设检验_第1页
第五章 统计估计与假设检验_第2页
第五章 统计估计与假设检验_第3页
第五章 统计估计与假设检验_第4页
第五章 统计估计与假设检验_第5页
资源描述:

《第五章 统计估计与假设检验》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第五章 统计估计和假设检验统计学的基本问题就是根据样本所提供的信息对总体的分布以及分布的数字特征作出统计推断。统计推断包括两大部分:一是统计估计,二是假设检验。统计估计问题就是根据样本的数字特征来估计总体参数的数字特征,因此通常也称作参数估计。参数估计根据所得出结论的方式不同有两种形式:点估计和区间估计。假设检验就是对关于总体分布的一些数字特征或分布函数所做的假设进行检验,以判断其正确性。假设检验也分为两类:一类是对总体分布的一些数字特征进行检验,称为参数假设检验;另一类是要求根据样本所提供的信息对关于分布函数的假设进行检验,此时只检验分布,而不对参数作检验,这称作非

2、参数的假设检验。非参数检验将在第六章进行讨论,本章着重讨论参数检验。第一节 点估计一、点估计的极大似然法点估计就是以单个数据对总体参数值作出估计。若未知的总体参数为,这时是一个未知的常数。我们根据抽样样本的观察值构造一个统计量()来估计总体参数。由于抽样的随机性,统计量是一个随机变量。点估计就是将的具体值作为的估计值。显然,这样做必然会有误差产生。这种误差就称为抽样误差。  极大似然法是一种对参数点估计的重要方法之一。我们先用一个例子说明其原理。例5-1。设有一批产品,质量上分为正品与次品。产品的次品率有两种估计:0.1和0.4,今随机抽样15件产品,发现只有一件是次

3、品。现根据这一抽样情况,来决定用哪一种次品率来估计更为可靠呢?记A=“抽取15件产品,只有一件是次品”,设抽得正品用X=0,抽得次品用X=1来表示。抽样结果只有X=0与X=1两种情形,于是,可得事件A发生的概率为:P(A)=其中:是这批产品的次品率。若次品率=0.1,则P(A)=×0.1=0.0229若次品率=0.4,则P(A)=×0.4=0.0003。现在事件A既然在一次观察中就发生了,直观地我们可以认为事件A发生的概率P(A)不会小,故应选择使P(A)较大的次品率作为产品的次品率的估计更为可靠些。由于0.0229>0.0003,故应选择0.1作为产品的次品率比

4、选择0.4更可靠些。把上例推广到一般的情形,我们就可以得到极大似然法的一般原理。设是取自密度函数为f(x,)的总体的一组样本。其中:x和都为参数,待估计。的极大似然估计的基本思路是,若记A=“一次观察中,所得一组样本的样本值为()”。现在在一次观察中A发生了,即P(A)应尽可能地大,即应在所有可能取值的集合中选出一个使P(A)达到最大值的作为的估计值。此时的又称为的极大似然估计值。由于相互独立,且都与X具有相同的分布,由此可以得到,P(A)就相当于事件:同时发生的概率,也就是P(A)=,记为L()=L(),于是有:L()=78L()称为的似然函数。求极大似然值的问题就

5、是求似然函数L()的最大值问题,根据微分学的结果,L()取到最大值的必要条件是它对的导数为零。因为lnL()与L()取得极大值的点相同,为计算方便,我们通常就用对数似然方程来求解最大似然估计值。  在我们上述例子中,f(1,)=,f(0,)=1-,于是得到似然函数:  L()=令=0,舍去=1,得的最大似然估计值=0.067。  实际上,正是在15次抽样中得到一次次品的频率,用频率估计概率,当n充分大时无疑是合理的。例5-2。从一个正态总体中抽取容量为n的样本,求总体参数的极大似然估计。解:构造似然函数为了求和,使ln的极大,令解上述方程得到:所以得到和的极大似然

6、估计量为: 二、估计量好坏的评选标准  前面讨论了如何利用极大似然法来求参数的估计量。但对于同一个参数可以用不同的方法来求其估计量,于是,在参数估计中就存在怎样选择一个比较好的统计量来推断总体参数的理论问题。那么,什么样的估计量是好的估计量呢。这就有一个如何对估计进行评价的问题。请看下面一个例子。例5-3。假如某一建设单位购进了一批建筑用的线材,就需要了解这批线材的平均抗拉强度是多少。现在要通过抽样,选择样本的某个函数(统计量)来推断总体指标值。由于随机原因,每次抽取样本的测量结果是不同的。如果样本容量为3,抽取4组样本,测得结果如表5-1所示。表5-1一组抽样样本的

7、观察值样本值样本顺序均值1900999101197029951050110510653101094189094749509101140100078为了说明的方便起见,我们假定,实际上μ=1000公斤,当然这在事先是不知道的。我们要求利用样本信息来推断总体指标,并使其误差最小。第一组样本的中位数最接近总体指标,第二组样本是最小值最接近总体指标,第三组样本是最大值最接近总体指标,第四组样本是均值刚好等于总体指标。于是就产生了一个问题,在大量的实验中,究竟采用哪一个指标来推断总体指标更合理呢?  评价点估计的结果通常有无偏性、有效性和一致性等标准。1.无偏

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。