资源描述:
《总体比例的检测和置信区间》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第一节小总体情况——超几何分布第二节大总体情况——二项分布及大样本正态近似第二章总体比例的检测和置信区间教学重点根据不同的总体和样本选用适当方法检验总体分布比例计算总体比例的置信区间估计(置信度为1-α)第一节小总体情况——超几何分布在总体量N较小时检测总体比例用超几何分布。Hyper(x,k,N-k,n),其中,x和k分别是样本或总体中具有某种特征的个体数;N和n分别是总体和样本数;同时,π=k/N和π0=x/n分别是总体和样本中具有某种特征的比例。例2.1:p26,学生赞成“骑自行车在校门口应该下车”的比例检测。假设样本n=50,其中只有1人赞成该下车,问能否说“至少有1
2、0%的学生赞成下车的规定”?第一节小总体情况——超几何分布首先,计算样本中赞成的比例π0=x/n=1/50=0.02,显然低于10%,因此我们有理由怀疑总体中赞成的比例不会超过10%,这样可以建立如下假设:H0:π=π0=0.1H1:π<π0=0.1第一节小总体情况——超几何分布其次,假设总体量不大,N=400,应该用超几何分布Hyper(x,k,N-k,n)来检测,如此原假设就等价于如下假设H0:k=40与H1:k<40而超几何分布的模型为Hyper(1,k,400-k,50),需要计算x≤1的概率p值,即第一节小总体情况——超几何分布对于通常的显著性水平α=0.05,可以
3、拒绝零假设,得出支持出入下车的学生比例不足10%的结论。下面进一步计算k的100(1-α)%置信区间(k1,k2),或者π=k/N的100(1-α)%置信区间(π1,π2)=(k1/N,k2/N)。上限k2为满足不等式的最小的k;下限k1为满足不等式的最大的k。参见p29的表。第二节大总体情况—二项分布及大样本正态近似当总体量N很大时,超几何分布Hyper(x,k,N-k,n)用二项分布Bin(n,π)近似。例2.1(续)检验假设不变,二项分布的模型是Bin(50,π),在零假设成立时为Bin(50,0.1)。下面计算至少有1人不赞成的概率P(x≤1)的值按二项分布的公式得p
4、值为第二节大总体情况—二项分布及大样本正态近似因此,对于通常的显著性水平α=0.05,可以拒绝零假设,得出支持出入下车的学生比例不足10%的结论。下面进一步计算在二项分布假定下,总体比例π的100(1-α)%置信区间(π1,π2).其上限π2应为满足不等式的π;下限π1应为满足不等式的π。计算后例2.1中π的95%的置信区间为(0.000506,0.106469)第二节大总体情况—二项分布及大样本正态近似例2.2:随机调查多所大学的1752个学生,有979个支持减少必修课。能否说该市高校中有多于50%的学生都支持减少必修课的建议?能否找到支持这个建议的人数总体比例π的95%置
5、信区间?这是一个大总体、大样本的问题。要检验的假设为:H0:π=0.5与H1:π>0.5如果用二项分布模型Bin(1752,π),要计算x=979及更极端情况的概率P(x≥979)作为p值。第二节大总体情况—二项分布及大样本正态近似因此,即使对于通常的显著性水平α=0.001,也可以拒绝零假设,得出大部分支持减少必修课的结论。同时可以计算出π的95%置信区间为(0.53517,0.58221).正态近似:在样本量n很大时,可用均值为nπ,方差为nπ(1-π)的正态分布来对二项分布Bin(n,π)近似.这时,检验的假设为H0:π=π0对单边或双边的H1。检验统计量第二节大总体情
6、况—二项分布及大样本正态近似把观察到的=x/n代入检验统计量Z,就得到Z的实现:对应的p值=φ(z)≈1-φ(4.92153)≈0.0000.如果考虑连续性修正对应的p值=1-φ(z)≈0.0000.和不修正差不多。而总体比例π的95%置信区间为即例2.2的总体比例π的95%置信区间为(0.5232666,0.5693673),和二项分布得到的区间大体相同。小结:p35第二节大总体情况—二项分布及大样本正态近似符号检验(二项检验)在excel中的运用例:某种超常记忆训练法声称可以让80%的普通学生在1个小时内掌握60个单词,现随机抽取20个学生进行训练,其单词记忆个数如图16
7、.1中列B所示,试检验该训练法的成功(1小时掌握60个单词)概率是否能达到0.8(α=0.05)?H0:H1:其操作步骤为:1.在AB列输入原始数据;2.将原始数据转换为二项数据,在C2输入=IF(B2>=60,1,0),拖拉填充句柄往下一直复制到C21处;符号检验(二项检验)在excel中的运用3.计算成功的学生数,在F2输入=COUNTIF(C2:C21,"=1");4.计算未成功的学生数,在F3输入=COUNTIF(C2:C21,"=0");5.计算试验次数n,在F4输入=F2+F3。(一)双侧检