资源描述:
《《抽样统计》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第七章抽样统计本章主要阐述参数估计的基本概念,抽样分布,抽样的组织方式和抽样设计的基本问题。其中抽样组织方式有简单随机抽样,类型抽样,等距抽样,整群抽样,目录抽样,二重抽样和多阶段抽样§7.1抽样统计基本概念抽样统计又叫参数估计,是根据统计研究的任务和要求,从被研究总体中抽出部分单位进行调查,然后根据这一部分单位所求得的样本指标推断总体指标的统计方法.一.总体与样本抽样推断中的总体又称全及总体,即统计总体,是被研究现象的全体,是具有大量性,同质性和差异性的许多个别事物的集合体.总体单位数记N,7/15/2021样本是根据随机原则从总体中抽出来的进行调查的那一部
2、分总体单位所组成的集合体.样本中包含的单位个数记作n,又称样本容量,n/N称为抽样比例.二.参数和统计量参数是总体数量特征,亦即总体指标.总体的某个参数在抽样时往往是未知的,是需要进行推断的.统计量是样本的数量特征,亦即样本指标.统计量是随着样本不同而不同,因而是个随机变量.从总体中抽出的所有可能的样本的统计量及其相应的概率构成的分布,称为抽样分布.统计量通常有样本均值,样本方差,样本标准差,样本比例p等7/15/2021三.重复抽样与不重复抽样从N个总体单位中抽取n个组成样本,有重复抽样与不重复抽样两种抽取方法.重复抽样是:每抽出一个个体进行调查登记后,放回
3、去,再抽下一个,直到抽取登记n个为止.采用这种抽样方法时,每次每个单位被抽出的机会都是1/N.不重复抽样的方法是:每次抽出一个单位进行调查登记后,不再放回去,因此凡是前面已经抽到过的单位,以后不会再被抽到.故两种方式下可能抽到的样本个数M为(1)在重复抽样方法下:M=Nn,(2)在不重复抽样方法下:7/15/2021四.抽样误差与抽样标准误差统计中误差有两类,一是登记性误差,即在点数,测量,登记,计算,抄录等过程中产生的误差,二是代表性误差,即用非全面资料推算或代替总体指标时产生的误差.代表性误差又分为系统性与偶然性两种,系统性误差是指没有遵守随机原则而有意选
4、取变量值较大或较小单位组成样本造成的误差,这是应当避免的.偶然性误差是遵守了随机原则仍会产生的不可避免的误差.抽样标准误差是指所有可能的样本平均数对总体平均数的标准差,抽样标准误差的平方称为抽样方差.上式中因为总体均值一般未知,需推断的,故不用此实际计算,只作一些理论解释.7/15/2021影响抽样误差大小的因素有:一是样本容量n,其越大,误差就越小;二是总体标准差,其越大,说明总体中各数据差异越大,使抽样误差就大;三是抽样方法有关,一般重复抽样比不重复抽样的误差小些;四是与抽样方式有关.Th:设总体的均值(期望)为μ,方差为σ2,x1,x2,…,xn为样本,
5、为样本均值(1)若总体分布为,则精确分布为(2)若总体分布未知或不是正态分布,则n较大时,渐近分布为(3)在不重复抽样时,§7.2抽样分布7/15/2021§7.4简单随机抽样一.简单随机抽样方法简单随机抽样又称纯随机抽样,是一种最基本的抽样方式,是指从总体的全部单位中按随机原则直接抽取n个单位组成样本进行调查.具体做法有以下三种:(1)信手抽取法.即从研究总体中随手抽取所需的调查单位.(2)抽签法.即先把总体各单位全部编号,然后制成签条或卡片,将其混合均匀后从中抽取,抽满预定的样本容量为止.(3)随机数表法.即将十个数字完全按随机原则编成的表,用这些数字组成
6、的多位数.使用时,也应将全部总体单位编号,抽取的号码就决定抽取的个体.7/15/2021二.简单随机抽样标准误差(重复抽样)(不重复抽样)三简单随机抽样的必要抽样数目简单随机抽样的必要抽样数目就是指适当的样本容量n,一般来说,确定样本容量应考虑以下几个因素。(1)总体方差,总体方差越大,要求n越多.(2)极限误差.(3)概率度Z.(4)抽样方法.7/15/2021(重复抽样)(不重复抽样)基于上述四个因素的影响,样本容量的计算式可根据来确定(1)总体均值估计样本数(不重复抽样)(2)总体比率估计所需样本数(重复抽样)7/15/2021用上公式计算时,就注意:(
7、1)当抽样比例n/N较大时,应采用不重复抽样公式计算,否则采用重复抽样的.(2)当总体方差或总体比率未知时,可用样本方差(或样本比率),(3)在同一抽样调查中,总体均值与总体比率推断需要兼顾时,应采用计算出较大的那个样本容量.例7.147/15/2021§7.5分层抽样一.分层抽样的意义分层抽样又称类型抽样或分类抽样,实际上是将分组法与随机抽样法结合起来而形成的抽样方式.分组时应遵守分组原则,在各组中抽取调查单位时则应遵守随机原则.采用这种抽样方式时,应先将总体按有关标志分组,然后再从每组中按随机原则抽取样本.分层抽样可以提高抽样调查结果的精度,或者在一定条件
8、下减少样本的单位数以节约调查费用.因为