欢迎来到天天文库
浏览记录
ID:50408234
大小:280.00 KB
页数:32页
时间:2020-03-13
《均数率的抽样误差和参数估计.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第三节均数抽样误差的分布-t分布和总体均数估计lyy统计推断有2个重要方面:参数估计(estimatingparameters)假设检验(hypothesistesting)一、t分布t分布的特征1.t分布曲线以0为中心,单峰,左右两侧对称;2.t分布是一簇曲线。t分布有一个参数,即自由度=n-1。越小,t变量值的离散程度越大,曲线越扁平;逐渐增大,t分布曲线逐渐逼近标准正态曲线,若,则t分布曲线和标准正态曲线完全吻合。t分布的特征t界值附表t分布表单侧界值:P(t≥t,)=0t,t=n-1t
2、,=t0.05,19=1.729P(t,19≥1.729)=0.05例.n=20,=0.05求t,=?双侧界值t/2,:P(t≥t/2,)=/2P(t≤-t/2,)=/2,-t/2,0t/2,t/2/2t0.05/2,19=2.093P(t19≥2.093)=0.05/2P(t19≤-2.093)=0.05/2**P(-t/2,≤t≤t/2,)=1-2.双侧:P(t≤-t/2,)=P(t≥t/2,)=/2P(t≤-t/2,)+P(t≥t/2,)=,**
3、P(-t/2,≤t≤t/2,)=1-1.单侧:P(t≤-t,)=,P(t≥t,)=练习:1.n=20,=0.05,双测t界值=?2.n=23,=0.05,单测t界值=?n=23,=0.02,双测t界值=?二、总体均数的估计总体均数的估计有点(值)估计和区间估计。1.点(值)估计(pointestimation):即用样本均数作为总体均数的估计值。缺点是没有考虑抽样误差。2.总体均数的区间估计:总体均数的区间估计(intervalestimation):是根据抽样误差的规律,按一定概率(可信度
4、)估计总体均数所在的区间(范围)。可信区间(confidenceinterval):(a,b)可信度(confidencelevel):1-常用的可信度为1-=95%,99%。可信限(confidencelimit):可信区间的两个端点值。⑴未知且样本例数n较小(<100)总体均数的100(1-)%可信区间为:由t分布**P(-t/2,5、。试估计该地18岁男大学生身高均数的95%可信区间。=n-1=20-1=19,1-=0.95,=0.05,由t界值表,t0.05/2,19=2.093该地20名18岁男大学生身高均数的95%可信区间为:即(170.70,173.80)(cm)故该地18岁男大学生身高均数的95%可信区间为:170.70cm—173.80cm。⑵未知,但n足够大(n100)当n充分大时,t分布逼近u分布,此时,的1-可信区间为:中心极限定理:若XN(,),则N(,)若n充分大,有tu,例3.3某地调查110名18岁6、健康男大学生的身高,计算其平均身高为172.73cm,标准差为4.19cm。试估计该地18岁男大学生身高均数的95%可信区间。n=110,=0.05,u0.05/2=1.96该地20岁男大学生身高均数的95%可信区间为:该地20岁男大学生身高均数的99%可信区间为:(171.72,173.74)(cm)可信度并非愈高愈好。应兼顾精度。即⑶已知的1-可信区间为:第四节总体率的估计一、阳性率p的标准误p的标准误理论值:p的标准误估计值:例4.22003年某市随机调查50岁以上的中老年妇女776人,其中患有骨质疏7、松症的322人,患病率为41.5%,试估计该样本率的抽样误差。意义:此类调查,每个样本的样本率与总体率都不相等,相差有多有少,平均相差1.77%。二、总体率的估计1.查表法(当n50;p或1-p很小)(附表7)例3.6某医生用某方法矫正30名近视眼患者的视力,其中8人近期有效,求该方法的近期有效率的95%可信区间。依n=30,X=8查附表7故该方法近期有效率的95%可信区间为:12%46%例4.6某中学用一新方法矫治近视50例,其中26名近期有效。试求该法近期有效率的99%可信区间。表7只列出Xn/2部分。本例n8、=50,X=26>n/2应先以n-X查“阴性率”的可信区间,再用100%减之。以n=50,X`=50-26=24查表,“阴性率”的99%可信区间为:30%67%100%-30%=70%,100%-67%=33%故该法近期有效率的99%可信区间为:33%70%(二)正态近似法(np5,且n(1-p)5)总体率的1-可信区
5、。试估计该地18岁男大学生身高均数的95%可信区间。=n-1=20-1=19,1-=0.95,=0.05,由t界值表,t0.05/2,19=2.093该地20名18岁男大学生身高均数的95%可信区间为:即(170.70,173.80)(cm)故该地18岁男大学生身高均数的95%可信区间为:170.70cm—173.80cm。⑵未知,但n足够大(n100)当n充分大时,t分布逼近u分布,此时,的1-可信区间为:中心极限定理:若XN(,),则N(,)若n充分大,有tu,例3.3某地调查110名18岁
6、健康男大学生的身高,计算其平均身高为172.73cm,标准差为4.19cm。试估计该地18岁男大学生身高均数的95%可信区间。n=110,=0.05,u0.05/2=1.96该地20岁男大学生身高均数的95%可信区间为:该地20岁男大学生身高均数的99%可信区间为:(171.72,173.74)(cm)可信度并非愈高愈好。应兼顾精度。即⑶已知的1-可信区间为:第四节总体率的估计一、阳性率p的标准误p的标准误理论值:p的标准误估计值:例4.22003年某市随机调查50岁以上的中老年妇女776人,其中患有骨质疏
7、松症的322人,患病率为41.5%,试估计该样本率的抽样误差。意义:此类调查,每个样本的样本率与总体率都不相等,相差有多有少,平均相差1.77%。二、总体率的估计1.查表法(当n50;p或1-p很小)(附表7)例3.6某医生用某方法矫正30名近视眼患者的视力,其中8人近期有效,求该方法的近期有效率的95%可信区间。依n=30,X=8查附表7故该方法近期有效率的95%可信区间为:12%46%例4.6某中学用一新方法矫治近视50例,其中26名近期有效。试求该法近期有效率的99%可信区间。表7只列出Xn/2部分。本例n
8、=50,X=26>n/2应先以n-X查“阴性率”的可信区间,再用100%减之。以n=50,X`=50-26=24查表,“阴性率”的99%可信区间为:30%67%100%-30%=70%,100%-67%=33%故该法近期有效率的99%可信区间为:33%70%(二)正态近似法(np5,且n(1-p)5)总体率的1-可信区
此文档下载收益归作者所有