欢迎来到天天文库
浏览记录
ID:45658346
大小:318.50 KB
页数:41页
时间:2019-11-15
《《讲估计与检验》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第四讲估计与统计检验沈建荣jrshen@ynu.edu.cn一、区间估计总体均值区间估计总体均值置信水平为100(1-α)%的置信区间为:注意:1、估计成立的条件是:样本必须是随机、独立的;2、使用t分布表时,要求总体必须是近似正态的,需对样本作正态性检验;3、置信水平不是概率(置信区间是确定的而不是随机的),可以认为以置信水平(如95%)相信总体均值在执行区间内;或是说,置信水平这一计算方法可以使得置信区间以95%的概率覆盖总体均值。大样本下:方差未知:或小样本下例1某小组随机抽样调查了250户家庭的年收入,样本均值为9.8万,样本标准差为4.8万。小组给出一个置信
2、区间(9.2,10.4),但未给出置信水平。1、问该区间的置信水平?(试比较两种分布的情形)2、小组给出解释:该地区家庭平均年收入为9.2~10.4的概率为95%,这种说法对吗?3、若同时有10个小组在进行相同的独立调查,问9个或以上小组得出的95%置信区间都覆盖总体均值的概率是多少?提示:可以将每一个区间是否覆盖总体均值作为一次Bernoulli试验。令Y为覆盖总体均值的全金属区间数,显然Y~Bin(10,0.95)单侧置信区间总体均值100(1-α)%的置信区间:下限为:上限为:例21、同例1,问总体均值95%置信区间的下限?当置信水平提高时,估计的可靠性将(提高
3、or降低)?精确性将(提高or降低)?比例置信区间若X~Bin(n,p),由中心极限定理传统方法是以样本p代替总体p进行区间估计,最近的研究表明,Agresti–Coull区间有改进,置信水平为100(1-α)%的置信区间计算公式如下:若下限小于0则用0代替,上限大于1则用1代替。例3:某企业从所购买的元件中随机抽检了150份,有5份不合格,估计不合格品率95%置信区间。(试用传统方法和Agresti–Coull方法分别计算比较)根据指定精度确定所需样本数为获得总体平均100(1-α)%的置信区间,且要求区间宽度不超过D时,则需从这个总体中抽取随机样本数为:总体方差未
4、知的两阶段法:阶段1:从总体中抽取n1个先期样本(如n1=30),计算这个样本的方差S2;阶段2:以S2替代总体未知方差计算所需样本数n,若n>n1,再补抽n–n1份样本。另:请同学们自行计算确定总体比例所需样本数。例4例1中,若要求所获得总体均值99%置信区间的偏差为(+-)0.5万元,问至少要调查多少样本?例3中,若要求所获得总体不合格品率99%置信区间的偏差为(+-)0.5%万元,问至少要抽取多少样本?两个总体均值之差的置信区间根据第三讲的知识,请同学们自行给出大样本情形下的计算公式。小样本不能使用中心极限定理,可以使用t分布,计算公式:例5欲比较A、B两医院住
5、院病人的住院天数。随机抽取A医院64个住院病历,计算平均住院天数为6.54天,标准差为1.2;随机抽取B医院81个住院病历,计算平均住院天数为6.24天,标准差为0.96。则两个医院住院病人平均住院天数差的95%置信区间是多少?有人认为两个医院病人的住院时间没有差异,与上述数据矛盾吗?为什么?例6随机抽取A、B两地空气污染指数PSI,如下表所示A150146132164126128B9510411299109假设两地空气污染指数都服从正态分布,试估计两地PSI平均差95%置信区间。例7有文献给出一项对睡眠习惯的研究结果。在一个由87个成年人组成的样本中,每天躺在床上的
6、平均时间为7.70小时(不管处于清醒状态还是睡眠状态),标准差为1.02小时,其中处于睡眠状态的平均时间为7.06小时,标准差为1.11小时。所以躺在床上的平均清醒时间为7.70-7.06=0.64小时。有可能建立平均清醒时间95%的置信区间吗?如果行,是多少?如不行,为什么?例8:数据对的置信区间某轮胎制造商希望比较新、旧材料制成的轮胎的磨损情况。从每种轮胎中各选一个随机安装在10辆前驱汽车左、右前轮上。4万公里后测量磨损情况如下(单位:mm):12345678910新材料4.355.004.215.035.714.614.706.033.804.70旧材料4.19
7、4.624.044.725.524.264.276.243.464.50差值0.160.380.170.310.190.350.43-0.210.340.2问新、旧材料轮胎磨损差值95%的置信区间。两个总体比例之差的置信区间若X~Bin(nx,px),Y~Bin(ny,py),则px-py置信水平为100(1-α)%的置信区间的计算方法为:传统方法:改进方法:例9重复交易次数是顾客满意度的一个很好的度量。某企业随机抽取了今年的120个交易账户,有56个订购次数在2次以上。从去年抽取80个样本,有30个订购次数在2次以上。试计算这两年中订购次数在2次以
此文档下载收益归作者所有