资源描述:
《应用统计学:经济与管理中的数据分析5new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第五章参数估计(ParameterEstimation)•参数估计概述•点估计•一个总体参数的区间估计•两个总体参数的区间估计•样本容量的确定§5.1参数估计概述•参数估计的基本概念•点估计的基本概念•区间估计的基本概念•置信区间的性质一、参数估计的基本概念总体X的参从总体X中随机抽取一数θ未知个样本X1,X2,,Xn用样本统计量对总计算样本统计量体参数θ进行估计ˆ(x,x,,x)ˆˆxxx12n(1,2,,n)•参数估计:以样本统计量作为未知总体参数的估计量,并通过对样本单位的实际观察取得样
2、本数据,计算样本统计量的取值作为被估计参数的估计值。5-3二、点估计的基本概念•点估计(pointestimation):在估计中直接用样本统计量作为相应总体参数的估计量的方法。ˆˆ(x,x,,x)随机变量12nn1ˆˆ(x1,x2,,xn)xixni1例如n2(xix)i1ˆˆ(x,x,,x)s12nn15-4三、区间估计的基本概念•区间估计(intervalestimation):根据给定的置信度要求,给出总体参数被估计的上限与下限的估计方法。•一般来说,对于
3、被估计的总体参数,找出样本的两个估计量ˆ和ˆ(其中ˆˆ),有1221P(ˆ1ˆ2)1(01)随机区间•则称区间(ˆ,ˆ)为总体参数的估计区间,ˆ为121估计下限,ˆ为估计上限,1-α为估计置信度2,α为显著性水平。5-5Pxf(x)PxPxx(x)(x)置信水平11-αxx1x1x1x2x2x2x3x3x3构造若干个区间估计的示意图5-6四、置信区间的性质•(1)
4、抽取所有可能的样本,构造的所有可能的区间•(ˆ,ˆ),其中:有95%的区间包含参数真值,5%12的区间不包含参数真值,该区间称为置信水平为95%的置信区间。•(2)只抽取一个样本,得到一个区间,总体参数落在置信区间(ˆ,ˆ)的概率为95%。12•置信区间(ConfidenceInterval):用来估计总体参数的取值范围。〔统计量±概率度×抽样平均误差〕•置信水平(confidencelevel):区间估计的可靠度,用1-α表示。•显著性水平(significancelevel):区间估计的不可靠度
5、,用α表示。5-7•(1)置信区间的长度•短的置信区间能比长的置信区间提供更多的有关总体的信息。•(2)样本容量对置信区间的影响•大样本(包含总体的信息多)产生较短的置信区间,而小样本产生较大的置信区间。•因为,抽样误差与样本容量成反比。•(3)置信水平对置信区间的影响•低的置信水平(如90%)产生较短的置信区间,高的置信水平(如99%)产生较长的置信区间。•但90%的置信水平不如99%那么让人感觉可靠5-8•采用简单随机抽样,对总体比率进行参数估计,置信水平、抽样误差、样本容量三者之间的关系。需要的最小样
6、本容量190%95%99%1%68069604166412zp(1p)22%170224014160n23%75610671849p50%4%42560010405%2723846666%1892674627%139196340•选择n=1200,置信水平95%,抽样误差小于3%。5-9§5.2点估计•矩估计法•极大似然估计法•点估计的优良性准则定义:变量x对常数a的“k阶矩”为nkk(xia)ni1nk(1)原点矩kxini1任何分布的一阶原点矩就是分布的期望值。
7、(2)中心矩取ax,得到变量关于分布中心x的k阶矩,即“k阶中心矩”nkc(xx)nkii1任何分布的一阶中心矩总是为零,二阶中心矩就是分布的方差。5-11一、矩估计法基本思想:样本来自于总体,样本矩在一定程度上反映了总体矩。由大数定理可知,样本矩依概率收敛于总体矩。因此,只要总体X的k阶原点矩存在,就可以用样本矩作为总体矩的估计量,样本矩的函数作为总体矩的函数的估计量。优点:矩估计法简单、直观,而且不必知道总体的分布类型,得到广泛应用。局限性:要求总体的k阶原点矩存在,否则无法估计,它
8、不考虑总体的分布类型,因此,没有充分利用总体分布函数提供的信息。5-12矩估计法的步骤:①确定要估计的总体参数,设有m个待估参数。②列出矩与参数的关系式。有m个待估参数,计算1~m阶原点矩。kE(X)k1,2,,mk利用m个等式(1,2,,m),解关于(1,2,,m)的方程,得到f(,,,),i1,2,,mii12mn1k③用样本的k阶原点矩kxi代入上式中