欢迎来到天天文库
浏览记录
ID:19921087
大小:571.50 KB
页数:19页
时间:2018-10-07
《应用统计分析部分》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、应用统计分析部分第一章:抽样分布与设计一、抽样分布1、抽样的特点抽样的目的是用被抽取部分个体所求得的数值推断总体的数量特征。其中,抽取部分个体称为总体的一个样本。特别样本个数就是样本容量;样本取值就是样本观察值。抽样是对所研究的总体,按照随机原则抽取部分个体进行的调查。抽样的特点:随机原则:每个元素(或个体)有同等抽中的机会(具有代表性) 推断总体特征:样本的数值特征 推断 总体数量特征。 推断的精确性:把推断的误差控制在一定的精确度内(可靠性要求)2、样本平均数的分布正态总体分布:如果从正态分布总体N~(,)中随机抽取样本,则
2、样本平均数的分布具有如下性质:a: 样本的平均数的分布也是正态分布。b: 样本的平均数的平均数等于总体的平均数c:当从无限总体抽样(或从有限总体采用放回抽样)时,样本平均数 分布的方差等于总体的方差除以样本容量。即特别:当从有限总体不放回抽样时,样本平均数分布方差为:();简记(1-)总结:样本平均数服从正态分布:~N(,)非正态总体分布:如果总体不服从正态分布时,样本平均数分布性质则由中心极限定理来解释如下:a:只要数学期望和方差存在,从总体中随机相互独立抽取n个样本,则样本平均数是随机变量;19b:当n够大(一般n>30)时,则~N
3、(,) c:特别总体服从二点分布p(x=i)=p,p(x=0)=1-p时,则期望p方差p(1-p)故放回抽样时~,);不放回抽样时~,(1-))。样本平均数之差的分布:如果总体1:X~,抽n1个样本,如果总体2:Y~,抽n2个样本,则~二、抽样设计1、简单随机抽样:事前编好随机数据表总体(全部编号)标签(混合) 用手随机模取抽样 摇号机2、类型抽样(分层抽样或分类抽样):总体(按特征标志分组)组1随机抽样 ………………… 组k随机抽样 分配原则:等数;等比例;最优 设:总体为N(总体样本为n);分成k组,第i组包含
4、Ni个单位,样本为ni等数:n1=n2=……..=nk=等比例:;样本数最优:标志变动程度为,,样本数19样本平均数i组:; 总体:样本平均数总体方差:全样本平均数的方差是各类型方差的加权综合样本平均数i组方差:是第i组内资料的方差,取各类型样本方差的加权数综合1、整群抽样: 总体(按标志分成若干群) 随机抽取r个群 样本总体分为R个群,每群含为M个单位。设为第i个群中的第j个单位的标志值。i群平均数:i=1,2,…,r总体平均数:总体方差:样本平均数的群间方差其中,为总体各群的平均数;为总体的总平均数样本方差:样本的群间方差其中,为
5、抽样各群的样本平均数;为抽样各群全体样本的平均数19整群不放回抽样样本平均数的方差:注:等距抽样;多阶段抽样;双相抽样;穿插抽样(略)。 第二章:参数估计与假设检验一、参数估计问题随机变量特征(概率分布;均值;方差)如何?解决方式:根据样本来估计所要的信息;具体思路:用样本统计量估计总体参数。1、参数点估计量优劣的判别准则和常用的估计量点估计:用样本统计量估计总体参数一个明确的估计值准则:无偏性-----令为被估计参数;为的无偏估计量;则一致性:样本容量越大,估计量的值越接近于被估计总体参数有效性:,,如果的方差比的方差小,则比有效常用
6、估计量:①用样本的平均数估计总体平均数,即②用样本方差和标准差s估计总体方差和标准差即;③用样本中具有某特征单位的比例估计总体比率p,即2、参数区间估计问题区间估计:用样本估计总体参数可能取值的区间(给出了点估计可靠性的一种描述,是点估计的补充)选择两个统计量1和2 估计 P(1<<=1-(事先给定的正数)19,且1<2,[1,2]称为置信水平为1-的置信区间;1-置信概率(置信水平或置信系数);实有意义:有100(1-)%把握断定在[1,2]内。(1)总体平均数的区间估计假设:总体服从正态分布N();随机变量X的概率密度函数:f(x
7、)=;记作:x~N()如果令:Z=(统计量)则E(Z)=E()==0 D(Z)==E=E() =E(=1所以:Z~N(0,1)标准正态分布 密度函数 f(x)= 分布函数Φ(x)=Φ(-x)=1-Φ(x),P(a≤z≤b)=P(Z≤b)-P(Z≤a)第一种情况:样本取自总体方差已知(即已知)的正态分布,对总体期望值μ的区间估计已知:总体随机变量X~N(μ,2),则~N(μ,2/n),其中;2/n(放回)令:Z= ,则Z~N(0,1)19查正态分布表:P|Z|≤r =P(-r≤Z≤r)=2Φ(r)-1如果令P(|Z|≤r)=
8、0.955则 Φ(r)=0.9775(标准正态表得:r=2)即P(-2≤≤2)=0.955也就是:P(μ-2≤≤μ+2)=0.955(值落在总体平均数正负两个标准差之内的概率为95.5%)可得P(-2≤μ≤
此文档下载收益归作者所有