欢迎来到天天文库
浏览记录
ID:34433629
大小:3.77 MB
页数:20页
时间:2019-03-06
《教育统计学第六章》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、产生数据用图表呈现分布用数字描述分布描述相关关系整合数据正态分布概率分布抽样分布统计推论第六章抽样分布概率与概率分布比率的抽样分布平均数的抽样分布概率赋予了这个世界以不确定性,但我们却用它来寻找确定性。在统计学的世界里,唯一确定的是关于不确定性的确定性,它来自于对无限的想象。一、概率与概率分布例1如果连续试很多次1986年1月28日,美国挑战者号航天飞机升空后不久爆炸了。总统特别委员会开始调查,让参与发射计划的人估计,这样的发射失败的机会有多大?管理部分说,大概10万次才会发射一次。委员会成员物理学家费曼反问:“你们的意思是说,如果连续300年每天发射一次火
2、箭,你们预期只会失败一次?”随机不是偶然例2掷硬币当你掷一次硬币,出现正面,那是偶然,但如果你掷很多次,就会发现规律,随机描述的是长期下去会呈现有规则且可预测的模式。法国自然主义者Buffon掷了4040次,结果出现了2048次正面,南非数学家Kerrich掷了10000次,结果出现了5067次正面,英国统计学家Person神勇地掷了24000次,结果出现了12012次正面。下面是我用电脑模拟“掷”硬币的情况:随机现象与概率随机现象个别试验无法预知其结果,但是多次重复试验之后,其结果出现有规则的分布。概率描述在重复许多次的情形下,一个随机现象的某一结果应出现的比例,它是在0-
3、1之间的一个数字。我们永远无法观察到一个概率,但能想象在一连串永无休止的试验中发生的情况。概率分布例3瞎猜也能得分如果我完全凭猜测做三道判断题,做对1题的概率是多少?一共有多少种可能结果?每种结果的概率有多大?如果对1题得1分,会有几种得分?把这几种得分情况的概率画成直方图,就是概率分布:描述了一个随机现象所有可能结果及其概率是如何分布的。概率的性质1.任何随机事件的概率都是介于0到1之间的数;0≤P(A)≤12.所有可能结果合并起来的概率一定是1;P(Ω)=13.两个互不相容事件至少有一个发生的概率是它们各自概率的和;P(A+B)=P(A)+P(B)4.两个相互独立事件同时发生
4、的概率是它们各自概率的积;P(A·B)=P(A)·P(B)当n变大时……抽样分布例4乐透的抽样调查随机抽取n=1523人的一个SRS,得到一个买过乐透的样本比率ṕ,重复抽样1000次,就能得到1000个样本比率ṕ,并且能够画出p值的频率分布直方图。现在请想象一下,如果我们永不休止地从总体中抽取SRS,会发生什么?二、样本比率的抽样分布抽样分布是指从同一总体抽出所有可能样本,其样本统计量的概率分布模型。从一个成功比率为P的总体中随机抽取一个大小为n的样本,其样本比率ṕ的抽样分布:当n足够大时,近似正态分布;抽样分布的平均数即总体比率P:E(ṕ)=P;抽样分布的标准差(标准
5、误)为:σp=√P(1-P)/n从抽样分布到统计推断例5如何利用抽样分布?根据例4的资料,从总体中随机抽取一个n=1523的SRS,其分布遵循平均数为0.60、标准误为0.0125的正态分布,那么:随机抽取一个样本,在0.95的概率上,其中回答“买过”的人的样本比率(区间)会是多少?随机抽到一个有62%以上的人买过乐透的样本的概率是多少?利用样本比率的抽样分布0.95的概率上,样本比率ṕ的样本比率ṕ在62%以上的概率分布区间三、样本平均数的抽样分布抽样分布是指样本统计量的概率分布;当统计量是平均数而不是比率时,我们就可以得到样本平均数的抽样分布;从平均数为μ、标准差为σ的
6、总体中随机抽取大小为n的SRS,其样本平均数x的抽样分布:当样本容量n较大时,近似正态分布;抽样分布的平均数即总体均数μ:E(x)=μ;抽样分布的标准差(标准误)为:σx=σ/√n;中央极限定理标准误:理解抽样分布例6标准差与标准误某区市,12岁女童的身高,μ=141cm,σ=4cm。随机抽取1名12岁女童,其身高在142cm以上的可能性有多大?此乃总体分布:Z=(x-μ)/σ=0.25P(x≥142)=0.5-0.09871=0.40129随机抽取100名12岁女童,其平均身高在142cm以上的可能性有多大?此乃抽样分布:Z=(x-μ)/σx=2.50P(x≥142)=
7、0.5-0.49379=0.00621当σ不知道时怎么办:t分布通常情况下我们不会知道总体参数用样本标准差(s)估计总体标准差(σ)E(s)=σ用标准误的估计值(sx)估计σxSx=s/√n用t取代Zt=(x-μ)/sx(df=n-1)自由度例7degreeoffreedom有3个数,它们的平均数是4,这三个数分别是多少?当用样本统计量估计总体参数时,就产生了自由度自由度是变量可以自由取值的个数,即去掉限制条件后剩下的个数平均数抽样分布的两种形态总体
此文档下载收益归作者所有