欢迎来到天天文库
浏览记录
ID:50093984
大小:316.51 KB
页数:52页
时间:2020-03-08
《总体均数的估计.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第六章总体均数的估计均数的抽样误差与标准误t分布总体均数的估计为什么进行抽样?总体样本随机抽样推断抽样误差概念:由个体变异引起的,抽样造成的样本统计量与总体参数之间的差异称为抽样误差(samplingerror)。均数的抽样误差均数的抽样误差:抽样引起的样本均数与总体均数的差异称为均数的抽样误差。模拟试验1从均数为4.5,标准差为0.2的正态总体中作随机抽样。当样本量为20时,随机抽取100个样本,其样本均数、标准差及其总体均数的95%置信区间见表6.1。可见:各样本均数未必等于总体均数;样本均数之间存在差异样本均数的频数分布见表6.2可见:样本均数的分布很有规律,围绕着总体均数4.5,
2、中间多、两边少,左右对称。模拟试验1从均数为4.5,标准差为0.2的正态总体中作随机抽样,规定样本含量分别为5、10、20、50,每种样本含量均重复抽取1000次,结果可得到4个不同样本含量的样本均数的抽样分布图如图6.1。可见:得到的样本均数的分布仍然近似服从正态分布。数理统计的中心极限定理从正态分布N(,2)中,以固定n抽取样本,样本均数的分布仍服从正态分布。模拟试验2从非正态总体中抽样,观察其样本均数的抽样分布。非正态总体的分布如图6.2所示。规定样本含量分别为5、10、20、50,每种样本含量均重复抽取1000次,结果也可得到4个不同样本含量的样本均数的抽样分布图(图6.3)
3、。数理统计的中心极限定理即使是从偏态分布总体抽样,只要n足够大,样本均数的分布也近似正态分布。数理统计的中心极限定理样本均数的总体均数仍为,样本均数的标准差为。标准误(standarderror)样本均数的标准差称标准误,是说明均数抽样误差大小的指标,大,抽样误差大;反之,小,抽样误差小。标准误标准误的计算:标准误的估计值影响标准误大小的因素的大小与成正比与样本含量n的平方根成反比抽样误差越小,表明样本均数与总体均数越接近,即用样本均数估计总体均数的可靠性越大;反之,抽样误差越大,则用样本均数估计总体均数的可靠性越小。P74例6.1,6.2t分布t分布的由来t分布的特征t分布曲线下的
4、面积t分布的由来变量变换总体样本均数中心极限定理标准正态分布变量变换未知t分布英国W.S.Gosset于1908年以“student”笔名发表论文,证明它服从自由度为n-1的t分布如果抽取例数n=5的样本1000个,每个样本又都可以按下式计算出一个t值,可将1000个t值编制成频数表,作出直方图,则可得到一条光滑的曲线。(式6.3)同理,如果抽取例数n=15时,仍能得到一条t分布曲线,因此,当n变化时,就可以得到不同的t分布曲线,如图6.4:图6.4自由度分别为1、5、∞的t分布t分布的特征t分布是一簇曲线。t分布以0为中心,左右对称。其形态变化与自由度的大小有关。自由度越小,则t值
5、越分散,曲线越低平;自由度逐渐增大时,t分布逐渐逼近u分布(标准正态分布);当=∞时,t分布即为u分布。t分布曲线下面积规律t分布曲线下总面积仍为1或100%t分布曲线下面积以0为中心左右对称。t分布曲线下面积规律由于t分布是一簇曲线,故t分布曲线下面积固定面积(如95%或99%)的界值不是一个常量,而是随自由度的大小而变化,如P439附表3。附表2,t分布表的特点附表2的横标目为自由度,纵标目为概率P。一侧尾部面积称为单尾概率,两侧尾部面积之和称为双尾概率表中数字表示和确定时,对应的t界值,记作t,。附表2,t分布表的特点单尾概率对应的t界值用t,表示双尾概率对应的t界
6、值用t/2,表示当=30时,单侧概率P=0.05时单侧t,=1.697当=30时,双侧概率P=0.05时双侧t/2,=2.042exampleexample单侧:P(t≤-t0.05,30=-1.697)=0.05P(t≥t0.05,30=1.697)=0.05双侧:P(t≤-t0.05/2,30)+P(t≥t0.05/2,30)=0.05其通式为单侧:P(t≤-t,)=或P(t≥t,)=双侧:P(t≤-t/2,)+P(t≥t/2,)=图中非阴影部分面积的概率为,P(-t/2,7、计算的t值为负值时,可用其绝对值查表。总体均数的估计总体样本随机抽样推断统计分析统计描述统计推断参数估计假设检验参数估计用样本指标估计总体指标称为参数估计,是统计推断的一个重要方面。总体均数估计的两种方法点估计区间估计点估计是直接用样本统计量直接作为总体参数的估计值.点估计的缺点没有考虑抽样误差,无法评价估计值与真实值之间的差距总体均数估计的两种方法点估计区间估计区间估计概念:即按预先给定的概率估计参数所在的范围。该范围亦称可信区间
7、计算的t值为负值时,可用其绝对值查表。总体均数的估计总体样本随机抽样推断统计分析统计描述统计推断参数估计假设检验参数估计用样本指标估计总体指标称为参数估计,是统计推断的一个重要方面。总体均数估计的两种方法点估计区间估计点估计是直接用样本统计量直接作为总体参数的估计值.点估计的缺点没有考虑抽样误差,无法评价估计值与真实值之间的差距总体均数估计的两种方法点估计区间估计区间估计概念:即按预先给定的概率估计参数所在的范围。该范围亦称可信区间
此文档下载收益归作者所有