欢迎来到天天文库
浏览记录
ID:52101395
大小:801.00 KB
页数:26页
时间:2020-03-31
《《统计推断基础》PPT课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、统计推断基础总体样本抽取部分观察单位统计量参数统计推断统计推断statisticalinference如:样本均数样本标准差S样本率P如:总体均数总体标准差总体率内容:参数估计(estimationofparameters)包括:点估计与区间估计2.假设检验(testofhypothesis)总体样本抽取部分观察单位统计量参数统计推断第一节均数的抽样误差如:样本均数样本标准差S样本率P如:总体均数总体标准差总体率抽样误差(samplingerror):由于个体差异导致的样本统计量与总体参数间的差别;以及统
2、计量间的判别。一、抽样试验从正态分布总体N(5.00,0.50)中,每次随机抽取样本含量n=5,并计算其均数与标准差;重复抽取1000次,获得1000份样本;计算1000份样本的均数与标准差,并对1000份样本的均数作直方图。按上述方法再做样本含量n=10、样本含量n=30的抽样实验;比较计算结果。抽样试验(n=5)抽样试验(n=10)抽样试验(n=30)1000份样本抽样计算结果总体的均数总体标准差s均数的均数均数标准差n=55.000.504.990.22120.2236n=105.000.505.0
3、00.15800.1581n=305.000.505.000.09200.09133个抽样实验结果图示抽样实验小结均数的均数围绕总体均数上下波动。均数的标准差即标准误与总体标准差相差一个常数的倍数,即样本均数的标准误(StandardError)=样本标准差/从正态总体N(m,s)中抽取样本,获得均数的分布仍近似呈正态分布N(m,)。二、中心极限定理centrallimittheorem①即使从非正态总体中抽取样本,所得均数分布仍近似呈正态。②随着样本量的增大,样本均数的变异范围也逐渐变窄。第二节t分布与
4、可信区间一、t分布(Student’stdistribution)二、总体均数的估计1.总体均数的点估计(pointestimation)与区间估计2.总体均数的可信区间(confidenceinterval,CI)3.总体均数差的可信区间4.大样本总体均数的可信区间三、可信区间的解释一、t分布随机变量XN(m,s)标准正态分布N(0,1)u变换均数标准正态分布N(0,1)t分布t(n-1)t分布的概率密度函数式中为伽玛函数;圆周率为自由度(degreeoffreedom),是t分布的唯一参数;t为随机变
5、量。以t为横轴,f(t)为纵轴,可绘制t分布曲线。t分布曲线t分布有如下性质:①单峰分布,曲线在t=0处最高,并以t=0为中心左右对称②与正态分布相比,曲线最高处较矮,两尾部翘得高(见绿线)③随自由度增大,曲线逐渐接近正态分布;分布的极限为标准正态分布。t分布曲线下面积(附表2)双侧t0.05/2,9=2.262=单侧t0.025,9单侧t0.05,9=1.833双侧t0.01/2,9=3.250=单侧t0.005,9单侧t0.01,9=2.821双侧t0.05/2,∞=1.96=单侧t0.025,∞单侧
6、t0.05,∞=1.64t界值表二、总体均数的估计1.总体均数的点估计与区间估计参数的估计点估计:由样本统计量直接估计总体参数区间估计:在一定可信度(Confidencelevel)下,同时考虑抽样误差可信度与可信区间区间的可信度(如95%或99%)是重复抽样(如1000次)时,样本(如n=5)区间包含总体参数(m)的百分数。常用100(1-α)%或(1-α)表示,α值一般取0.05或0.01。可信度实验2.总体均数的可信区间3.两总体均数差的可信区间4.大样本总体均数的可信区间(1)4.大样本总体均数的
7、可信区间(2)三、可信区间的解释95%可信区间:从总体中作随机抽样,作100次抽样,每个样本可算得一个可信区间,得100个可信区间,平均有95个可信区间包括μ(估计正确),只有5个可信区间不包括μ(估计错误)。95%可信区间99%可信区间公式区间范围窄宽估计错误的概率大(0.05)小(0.01)
此文档下载收益归作者所有