第五章比率估计与回归估计

第五章比率估计与回归估计

ID:19539626

大小:1.15 MB

页数:35页

时间:2018-10-03

上传者:U-2462
第五章比率估计与回归估计_第1页
第五章比率估计与回归估计_第2页
第五章比率估计与回归估计_第3页
第五章比率估计与回归估计_第4页
第五章比率估计与回归估计_第5页
资源描述:

《第五章比率估计与回归估计》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

第五章 比率估计与回归估计 2本章要点本章讨论了简单随机抽样和分层随机抽样下比率估计量和回归估计量的构造及性质。要求:①掌握总体比率、比率估计量及回归估计量的概念。②了解比率估计量、回归估计量的偏倚、方差及方差的估计量。③掌握应用比率估计量及回归估计量的条件。 3第一节问题的提出在许多实际问题中常常涉及两个调查变量(指标)Y和X。对于包含个抽样单元的总体除了对总体信息进行估计外,常常要估计总体比率R。总体比率在形式上总是表现为两个变量总值或均值之比。在涉及两个变量的抽样调查中,有两种情况需要应用比率估计量。一种情况是利用双变量样本对总体比率进行估计需应用比率估计量,此时两个变量均为调查变量。另一种情况是一个变量为调查变量,另一个变量表现为与调查变量有密切关系的辅助变量,在对调查变量总体总值、总体均值等目标量进行估计时,利用已知的辅助变量信息构造比率估计量可以改进估计的精度。基于这种考虑利用已知的辅助变量信息构造比率估计量就可使估计精度加以改进。 4第二节比率估计一、比率估计量设对有两个调查变量Y和X的总体进行简单随机抽样,分别以y,x表示样本总值,以表示样本均值,以为样本比率,用作为总体比率R的估计称为的比率估计。比率估计量除了使用调查变量样本信息外,还要使用辅助变量总体信息与样本信息,而且是非线性估计量。这类估计量称为复杂估计量。由于比率估计量使用的信息比简单估计量多,因而有可能比简单估计量有更高的精度。同时由于比率估计量是非线性估计量,因而对其性质的研究比对简单估计量要复杂得多。 5二、比率估计量的偏倚与均方误差比率估计量是有偏估计量,但当样本量增大时其偏倚将趋于零。理论上可以证明,分别为的近似无偏估计量,而且对于比率估计量,其方差主要取决于与之间的差异,当时,估计量方差将很小。换言之,比率估计量将有很高的精度。这告诉我们,只有当两个变量大致成正比例关系时,应用比率估计量才能使估计精度有较大改进。 6三、比率估计量方差的估计与置信区间对于一般的n,比率估计量呈右偏分布,只有当n>30,<0.1,<0.1这些条件同时满足时才能直接用正态分布构造置信区间。R的置信区间为[]其中是标准正态分布的上α/2分位点,0<α<1。类似可得、Y的置信区间。 7案例一 8解答过程 9案例二 10解答过程 11四、比率估计量优于简单估计量的条件定量分析计算表明,并非任何情况下比率估计量都优于简单估计量,只有当调查变量与辅助变量有较高的正相关性时比率估计量才能使估计精度有较大提高。若≈,则只需当ρ>0.5时比率估计量就比简单估计量精度高。 12五、多元比率估计对于调查变量Y,若有p个具有正相关性的辅助变量则可构造多元比率估计。设是的基于第k个辅助变量的比率估计,则的多元比率估计量为:其中是相应变量的样本总值,是辅助变量总体均值,是适当选取的权,满足。利用拉格朗日乘数法可计算得此时最小方差为 13案例三 14解答过程 15六、乘积估计当辅助变量X与调查变量Y呈负相关关系时,不能应用比率估计而应改用乘积估计乘积估计优于简单估计的条件是<此时<在实际问题中与调查变量呈负相关的变量很少见,因此乘积估计应用极为有限。 16第三节回归估计一、定义在简单随机抽样下,总体均值和总体总值Y的回归估计量定义为:其中,分别为调查变量、辅助变量的样本均值,是辅助变量的总体均值,称为回归系数。 17二、β为设定常数情形设是设定常数,取β=,则回归估计量是的无偏估计量。其方差为当时达最小值 18三、β取样本回归系数情形若β需根据样本确定,一个合理的选择是取β为样本回归系数此时的回归估计量为一复杂估计量,不再具有无偏性。 19四、回归估计与比率估计及简单估计的大样本比较对于大的样本量,总有这就是说在大样本下回归估计总是优于简单估计,仅在ρ=0时两者效果相同。的充分必要条件为这等价于因此除非Y关于X的总体回归系数B=R,否则回归估计总是优于比率估计,仅在B=R时两者效果相同。 20案例四 21解答过程(1) 22解答过程(2) 23解答过程(3) 24第四节分层比率估计与分层回归估计一、分别比率估计与联合比率估计(一)分别比率估计 25(二)联合比率估计 26二分别回归估计与联合回归估计(一)分别回归估计 27(二)联合回归估计 28三、各种估计量的比较对分层随机抽样在有辅助变量可利用时,为提高估计精度可以采用分别比率估计、联合比率估计、分别回归估计、联合回归估计等多种形式的估计量,因此自然存在一个问题,即如何对这些估计量进行比较。由以上各种估计量的构造可以知道,分别比率估计和分别回归估计必须使用总体各层的辅助变量均值或总值的信息,而联合比率估计和联合回归估计不要求使用总体各层的辅助变量信息,只要求使用总体的辅助变量均值或总值X的信息,分别估计量比联合估计量对总体信息的使用更详细一些,因此,当各层样本量都比较大时,分别比率估计精度比联合比率估计高,分别回归估计精度比联合回归估计高。但是各层样本量较小时,分别比率估计、分别回归估计将有较大偏倚,从而均方误差比较大。此时如果总样本量比较大,则采用联合比率估计、联合回归估计更好一些。 29案例五 30解答过程(1)相邻两年产量之间存在较高的正相关性,因此对今年平均亩产进行估计时以去年产量为辅助变量构造分层比率估计和分层回归估计是适宜的,此处(1)分别比率估计 31解答过程(2)(2)联合比率估计 32解答过程(3)(3)分别回归估计 33解答过程(4)(4)联合回归估计以上结果表明不论是比率估计还是回归估计,总有分别估计量优于联合估计量;不论是分别估计量还是联合估计量,总有回归估计优于比率估计。 34编号为奇数的习题答案5.1=2000,=36,1-=0.95,t=1.96,=0.018,0.000015359,=0.00392置信区间为。5.3当时用第一种方法,当时用第二种方法,当时两种方法都可使用。这是因为:,,若则0<﹥0 355.5证明:由(5.6)得:5.7解:故估计量虽然与一样都是的无偏估计,但方差不小于的方差,当时,故不优于。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭