资源描述:
《第5,6讲课本翻译》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、P65第五讲:二项抽样分布5.1基本前提什么引发了二项抽样分布,我们做出了如下的思考:1.对于我们而言,我们拥有一个很大的总体,这个总体由两类客体组成,通常将其归类为“成功”和“失败”;2.我们从总体中随机抽取n个人样本条目,感兴趣的样本统计量是X,X为在抽样中成功的次数;3.我们希望用X去推断未知参数P,P表示在总体中成功所占的真实比例。X=n个样本中成功的次数总体包含两类客体成功和失败P=成功的概率(感兴趣的参数,值未知)那么X可能的分布会是什么?我们该如何来计算关于X的概率呢?P66二项抽样分布可以用来模拟关
2、于在一次抽样中所观测到的成功次数的可能性和几率,它具有广泛的适用性。在我派生这个结论之前,我将提供几个应用二项分布的不同实例。例一掷硬币:假设你掷一枚均匀的硬币10次,由多少机会你恰恰能够看到四次正面向上?九次正面呢?全都是正面向上呢?例二随机猜测:假定你参加一场考试,共有5道单项选择题,每个问题有四个备选答案(其中只有一个是正确的),假设你未做任何备考准备,因此你只能完全随机地猜测每一个问题的答案,那么你恰恰猜对2道题的机会有多大?如果60﹪为及格线,你考试失败的概率又是多少呢?例三公共民意调查:假定奥巴马的公众
3、支持率的真实值为62﹪,即62﹪的美国公民对奥巴马在总统任职期间的表现满意。如果你随机抽取1000名美国公民,你的样本引起关于奥巴马支持率的估计的边际误差在±3﹪之内的概率是多少?即产生的样本估计值在59﹪到65﹪之间。例四质量控制:一种制造程序如果其产品不超过5﹪的次品则被认为是在“控制之内”。一位质量控制工程师随机抽取了40件,在其中发现了3件次品,那么该程序是否该被宣布“失控”了呢?例五假期销量数据:以下是收集到的从十月到十二月美国多个商铺威瑞森手机卖场手机周销量中位数的数据,这12个星期各卖场手机销量的平均
4、数如下:45,1432,39,29,64,55,38,212,187,124,320,188.去年每个卖场每周假日销量的中位数是100部,是否有充分的依据来推断今年的销量超过了去年?P675.2二项分布的推导我们从上述实例中的随机猜测问题开始,当我们随机猜测10次时,每一个结果将会是一个“对”或“错”,假设我们定义正确答案为“成功(success)”,那么在每一个问题上得到正确答案的概率是:p=P(success)=P(正确答案)=¼=0.25从总体的角度来看,如果你继续回答令人作呕的试题的话,你可能认为P是你可能
5、猜中正确答案次数的真实比例。那现在做一次这个实验,随机猜测着5道题,你将会看到一个由正确答案(用“C”表示)和错误答案(用“W”表示)所组成的排列,用X表示在测试中正确回答的个数,假定你看见这样的结果发生:WWCCW这个排列结果发生的概率是多少?因为它是一个由独立输出结果构成的排列,基础概率规则可以用来解释这个排列如下,P(WWCCW)=P(W)×P(W)×P(C)×P(C)×P(W)=0.75×0.75×0.25×0.25×0.75=(0.25)2(0.75)3=0.02636.这是在5道题中猜对2道的概率吗?即
6、这是P(X=2)吗?不是。为什么不是呢?因为这仅仅只是让我们可以可以看到2个“C”和3个“W”的一种情况下的排列,特别是排列WWCCW指的仅仅是我们把问题3和4答对的排列,那如果我们把问题1和4答对是呢?或者2和5呢?或者3和5呢?这些都是X=2时的情形。组合为了正确地计算得到2个正确答案和3个错误回答的概率,我们必须找出由多少种方法我们可以在5道题中成功的猜对2道题,这是所有可能的排列:CCWWWCWCWWCWWCWCWWWCWCCWWWCWCWWCWWCWWCCWWWCWCWWWCC数学的方法来计算总共有多少种
7、组合方法是通过运用二项式系数:此时:n!=n(n-1)(n-2)…3·2·1(定义:0!=1)被读作“n选x”,特别地,从5道题中2道选中正确答案的组合数被表达为:P6814因此,在5道题中恰好2道选中正确答案的概率是:P(X=2)=(即有26.4﹪的可能你会用猜的方式恰好在5个问题中做对2个题)希望你可以看出结构概率如何得来,这样的话,找出这个例子中所有可能结果的真实概率将会变得很简单,即就是X=0,1,2,3,4,5时的概率,如下:P(全错)=P(X=0)=P(对一道)=P(X=1)=P(对两道)=P(X=2)
8、=P(对三道)=P(X=3)=P(对四道)=P(X=4)=P(全对)=P(X=5)=注意:以上所有的概率加和为1,确认这是一个合规的概率分布,所有这些概率一起共同组成了n=5,p=0.25的二项抽样分布,即X~Bin(5,0.25).14二项抽样分布1.我们从一个仅由“成功”和“失败”构成的大的总体中随机抽取n个样本,设P=总体中成功的真实比例。2.X=在样