分层抽样下提高估计精度的探究.doc

分层抽样下提高估计精度的探究.doc

ID:51947784

大小:85.50 KB

页数:7页

时间:2020-03-20

分层抽样下提高估计精度的探究.doc_第1页
分层抽样下提高估计精度的探究.doc_第2页
分层抽样下提高估计精度的探究.doc_第3页
分层抽样下提高估计精度的探究.doc_第4页
分层抽样下提高估计精度的探究.doc_第5页
资源描述:

《分层抽样下提高估计精度的探究.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、分层抽样下提高估计精度的探究■经济分层抽样下提高估计精度的探究罗锂莹摘要:分层抽样是随机抽样的常用抽样方法之一。在抽样中常可伴随获得辅助变量的样本信息,这些信息对提高估计精度有积极作用。常用的估计方法有简单估计,比估计z回归估计。本文将在分层抽样的基础上,利用比估计量的构造提高分层抽样的精度。并根据分层抽样和估计构造的技术路线,对世界五百强企业营业收入研究过程进行实证分析,采用尼曼分配和比例分配分别估计样本量,最后采取比估计的构造方法提高样本精度。关键词:分层抽样比例分配尼曼分配比估计—、研究概述现在社会上普遍常用的分配方法有比例分配,尼曼分配,最优分配三种。比例分配是

2、在总体中的任一个单位,不管在那一层,都以同样的概率入样,估计量简单,也称为自加权样本。尼曼分配是最优分配的特例,假设每层抽样费用相同。最优分配是在总费用给定的情况下,使估计量方差达到最小或者在给定方差下使总费用最小。在不考虑费用的情况下,采用比例分配和尼曼分配分别确定样本量,再利用不同的分层方式进行简单随机抽样,抽出样本y后,先使用简单估计估计均值及方差,估计精度较差。一般采用比估计来估计总体均值,提高估计精度,比估计是基于基本信息和辅助信息,利用已知的辅助变量信息构造比率估计量可以改进估计精度。比估计分为联合比估计、分别比估计,一般情况下总有分别比估计的精度优于联合比

3、估计量。二、估计量的性质1、总体均值简单估计量的无偏性。在以500强营业收入为总体的分层抽样中,对总体均值估计通过各层的均值,通过各层层权加权平均得到:Yst=EWhYh=(1/N)ENhK当利用样本对总体进行估计时,总体均值Y的简单估计量为:a•.y次二力WbyF(1/N)LNhyh证明得到:E(yst)=E(EW;N)二EWkE(yh)二EWhY^Y2、总体均值方差简单估计量的无偏性V(yst)=(1/n)E(府/wJSf-(1/N)E(Wj/WjSj3、总体均值比率估计量的近似无偏性•AR二y/x,R^l/nEyx/xx,yr=LWhyr=L冈卜必/忑*乂二1/N

4、Ey"Xh*Xh4、总体均値方差比率估计暈的近似无偏性V(yR)=(1-f)/n*[E(Y厂RXJ/(N—l)1、确走分层标志分层是按一定标志进行,为使各层间的差异尽量大,从理论上讲,选择调查标志本身作分层标志时,分层的效果最好,但这在现实较难实现。常常采用调查标志关系密切的其它标志来分层的方法代替。分层标志的确定一般分为单项目分层和多项目分层,二者的复杂程度不同。本文基于单项目抽样z一般采用利用调查标志的全面的过去资料的方法。2、选取分层方法选取的分层的方法一般有历史数据法,散点图法,累积平方根法。在这里采用散点图与累积平方根法结合的方式,通过对散点图进行观察,确定大

5、致分层的层数为N层。之后对数据进行累计平方根法的分层。实验方法是对不同的数据的散点图的平滑陡111肖程度确定数据应采取等距还是不等距分组,数据集中时采〕等距分组,数据分散部分采〕不等距分组。再通过累计平方根法,确定公司数为频数。然后确定累计频率及平方根。最后确定每组的分层数Nl,N2,•…NL将层数计算得到Ni/N相应的层权W1,但简单估计虽浓通常估计精度较差。在能够获得辅助仁息的条件卜.通常采用比估计或者回归估计用以改善估计的精度。比估计是利用获得与Y高度相关的辅助变呈d在X的总体均值或者总体总值的己知情况卜利用辅助变虽构造调査变虽的总体均值或总值的比率估计虽。■R=

6、yx=yxA••Y=yy=RX=(y/x)•aY产RX二(y/x)*X=Nys值得注意的是比侶计呈是有偏的.但是偏差不大.、勺样本无穷大时将会近似无偏。在分层抽样抽样中分层的比率估计量分为分射比伕汁和联合比佔计.分别比估计的估计精度优「•联合比估十。•••Y«=22區Yt=EWh5rn»=52WhRbXhV(鼻)=EWh2[(l-fh)/nh:♦(S^:-2RS^-R=S^:)五、实证分析相关调查机构为了解2011年在金融危机3年后,世界500强企业的一个营运情况,对2011年世界500强企业进行分层随机抽样z组成一个样本容量为N的样本。本例中费用尚未给定,因此本例中同

7、时采用比例分配和假设每层抽样费用一致的尼曼分配进行样本量的确定,然后进行对比,选取其中精度较优的分配确定样本量。最后采用简单估计和比率估计两种方式来估计2011年的世界500强企业的营业收入,选取精度更高的估计作为最终的估计结果。1、总体分层利用2010年世界500强营业收入作为一个历史数据作为先验信息.进行观察确定大致的分层范围。根据散点图的分布形态确定数据特征以及分层点,确认分层点后,采取累计平方根法对数据进行分组分层。由于数据存在极端值,将剔除干扰数据的三个极端值后,将世界500强企业分为四层,包括历年不存在与500强,今年存在于5

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。