欢迎来到天天文库
浏览记录
ID:52321111
大小:1.42 MB
页数:55页
时间:2020-04-04
《比估计与回归估计.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、前面讨论的简单随机抽样和分层抽样,我们所关心的参数都是单指标的,给出的估计量也是线性形式。这一章我们将要讨论比较复杂的情况,我们关心的参数不再是单指标的而是两个或两个以上的指标。此时,遇到的统计量不再是线性形式,往往呈现出非线性形式,比如两个变量之比,或呈现变量之间的回归关系。第五章比估计与回归估计所谓回归关系就是变量之间的关系不是确定的,是带有随机影响的。比如身高和体重的关系,身高增加时,一般来说,体重也会增加,但又不能说一定如此。要确定身高和体§1概述一、问题的提出重的关系,一般用回归的方法。这类问题首先是由英国统计学家高尔
2、顿研究儿子的身高与父亲身高关系时提出的,他发现儿子的身高有回到家族平均身高的趋势,因而把所得关系式称为回归方程,于是回归的名词就沿用下来了。比估计与比例估计辅助变量:用来帮助主要指标估计的其他指标。二、比估计与回归估计的作用与使用条件(一)作用:提高估计的精度(二)使用条件1.主要指标与辅助变量之间有良好的线性相关关系。2.辅助变量的总体总量或均值是已知的。§2比估计设有一个二元变量的总体:有4个参数是我们所熟悉的:————指标的平均数——指标的方差如果简单随机样本为,则及的估计为:在研究比估计之前,再引进一个新的参数——变量之
3、间的协方差:(5.1)之间的相关系数定义为:(5.2)(5.3)(5.4)在讨论比估计之前,先考察总体的两个平均数之比,即由于分别是的无偏估计,的估计自然定义为假如或已知,总体平均数与总体总和的比估计量定义为:(5.5)(5.6)通常的比估计是指(5.5)式与(5.6)式,而则称为比值的估计。由(5.5)式与(5.6)式可知,与的习性主要依赖于估计量,因此在不少场合,我们常用来说明。尽管分别是的无偏估计,由于的非线性形式,因此关于是有偏的,从而关于也是有偏的。一个合理的估计量,应该随着样本容量n的增加,估计量的期望与参数之差应该
4、越来越小并渐渐趋于零,即“渐近无偏”比估计是否渐近无偏呢?利用Taylor展开式,有将比估计表示为:(5.7)当n相当大时,与相当接近,而是常数,又是的无偏估计,因此,实质上,所以。(5.7)式的好处不单单告诉我们这一事实,而且告诉了我们,当n相当大时,,表明可以表示成的平均数,因此的分布可近似正态分布因此,可利用近似标准正态分布获得的置信区间而(5.8)另外(5.9)(5.10)公式(5.8)、(5.9)、(5.10)为我们提供了的估计量的形式。具体计算时,只要将分别换为即可。我们将由此得到的估计量分别记为:那么,的置信水平为
5、的置信区间分别为:(,)(,)(5.11)下面说明比估计的优点。主要针对与来说明,因为它们仅相差一个常数因子,因此,只需讨论其中一个就可以。当n充分大时,而欲使,仅需或即(5.12)(,)(5.12)表明,如果变量X与Y正相关,且相关程度非常密切的话,那么比估计的精度高于简单随机抽样的精度。如果相关程度不那么密切(),此时已知的X信息并没有较多地提供Y的信息,借助X来推断也许会“帮倒忙”假如X与Y是负相关,则更不能采用比估计方法,此时应采用所谓乘积估计,即:当n充分大时,且满足:(5.14)(5.13)成立例5.1某县小麦种植面
6、积为218756亩,分布在N=576个村,为估计全县产量,随机无放回地抽取n=24个村,所得数据如下123456789101112131415161718192021222324112.0129.1208.2158.5110.2123.3157.7154.298.7112.7125.560.3302361608444298349416428258347351158105.780.5163.098.7137.8141.2152.5142.5136.7153.293.0179.8308217492280378386428390376
7、432261483每个村有两个指标:面积和产量,即:经计算可得:所以该县平均亩产小麦估计为:采用比估计可得和分别为:仅利用数据估计该县小麦总产量与估计量方差分别为:显然,的方差远远小于的方差。理由很清楚!小麦亩产量与土地拥有量呈现正相关,且相关程度相当密切,因此,在抽样调查中对每个村了解有关产量和土地亩数,利用已知该县土地的固有已知数,能比较精确地推断总产量。事实上在实际操作中人们正是这样去做的!现在来求总产量的95%的置信区间,首先置信区间为:(,)§2分层抽样中的比估计1、分别比估计设总体分为k层,第h层的样本均值记为,在该
8、层中与的比估计记为,又记和为第h层中指标的平均数与总和,与分别为该层中的方差和协方差,若换为,换为,则显然表示该层样本的方差和协方差。我们可以得到有关总体和的分别比估计为:分层抽样中的比估计有两种:一是分层之后,先在各层获得比估计,然后按层权平均得到总体参数估计
此文档下载收益归作者所有