统计培训教材22抽样及样本容量

统计培训教材22抽样及样本容量

ID:38434972

大小:1.63 MB

页数:66页

时间:2019-06-12

统计培训教材22抽样及样本容量_第1页
统计培训教材22抽样及样本容量_第2页
统计培训教材22抽样及样本容量_第3页
统计培训教材22抽样及样本容量_第4页
统计培训教材22抽样及样本容量_第5页
资源描述:

《统计培训教材22抽样及样本容量》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、抽样及样本容量(Sampling&SampleSize)什么是抽样及为何要进行抽样?抽样是收集所有数据的一部分。使用该部分数据得出结论(进行推论)。为什么要进行抽样?因为查看所有数据可能成本太高。费时太长。造成破坏(例如、品尝测试)。一般可从比较少量的数据得出可靠的结论。总体情况:在操作上您可以定义现存的总体的边界、以便可以认出总体的每个个体、在理论上还可以进行编号。抽样目的:描述该总体的特征。示例:抽样调查(8月31日以前毕业的)大学校友、以确定在今后两年中他们至少将一个小孩送进大学的百分比。总体和过程

2、样本使用样本对总体进行推论:例如。平均值=X、比例=p过程情况:过程是动态的且不断变化的;过程中的个体并不是全可以鉴定的、因为某些个体尚不存在(如明天制造的那些个体)。目的:了解过程、以便采取行动改进或预测过程未来的行为。示例:我们估计下月发票中有5%至20%有错误(除非更改该过程)。总体和过程(续)使用样本对过程未来的行为进行推论昨天保存时间顺序!今天明天??20%5%10%15%抽样数据的时间曲线图???以时间顺序排列的过程输出抽样和改进项目确定过程周期和缺陷比率的基准性能;(例如:在控制图上绘出样本

3、数据)估计过程能力;(例如:计算一件样本中的缺陷)确定造成性能低下或数据变动的因素(X);(利用样本数据绘制图表、进行假设测试或回归分析)验证建议的改进工作;(比较从过程中抽取的新数据与从该过程抽取的旧数据)监视过程性能、必要时采取补救措施、并预测未来的性能;(在控制图上绘出新过程的样本数据)改进项目一般是对过程情况进行抽样:为什么要区别总体抽样和过程抽样?样本容量公式是为定义明确的静态(而且常常是理论上的)总体情况设计的。但是大多数抽样应用是针对动态的、尚未知的过程情况。将样本容量公式应用于过程抽样情况

4、可能得出错误的结论、除非满足一定的条件。要使推论有效、样本必须真实地代表总体或过程。总体所需的抽样策略不同于过程所需的抽样策略、以确保样本具有代表性(在下一节中讨论)。从稳定的过程中抽样如果过程是稳定的、样本容量公式可应用于过程情况。可获得具有特定精度的可靠估计值。当进行比较时、如果存在的差异具有一定功效、便可找出它们。(稳定的、可预测的过程)4045505560651357911131517192123252729313335373941从不稳定的过程中抽样然而许多过程是不稳定的。无论如何总要收集数据、

5、并绘制控制图或时间曲线图。识别特殊原因并清除之。使用样本容量公式求出的值是您应认为最小的数字;可能的话,需要收集更多的数据。存在特殊原因时,需要更大的样本容量,因为长期变动大于短期变异。使用公式时,您必须估计s(或p);您必须判断特殊原因如何影响该估计值,并根据您认为过程将会是什么情况来调整它。从不稳定的过程中抽样(续)当进行组之间的比较时:尽量在相同时间内获取每组的样本。当作结论或报告结论时、会存在这样一个风险、即这些结论可能不适用于将来。如果过程是不稳定的,可能的话,将一段很长的时间里得到的数据绘制于

6、一张控制图上,并圈出或特别标示您的样本所代表的数据点或时间区间。允许您和他人可直接从曲线观察过程的行为。帮助您判断这些结论在未来的可靠性。从过程中抽样对于过程情况,我们希望确保能够理解过程的行为。因此我们:在一段时间内进行系统或整群(非随机)抽样。即使随机抽样能适用于稳定过程,我们仍采用系统或整群抽样,并保持时间顺序以便能更好地表示过程行为。尽量从足够长的时间段中进行抽样,以便真实地表示过程中的变化源。运用您自己的判断和有关变化源的过程知识来确定多长时间进行一次抽样(每隔10个个体、每隔7个个体、每天、每

7、月等)。一般情况下、更加频繁地收集小样本、可确保随着时间的过去能真实地表示过程行为。绘制控制图或时间曲线图,以确定该过程是稳定的还是不稳定的(寻找非正常值、偏移、趋势或其它模式)。抽样方法代表性样本要使结论有效,样本必须具有代表性。数据应真实地表示总体或过程收集的数据与未收集的数据之间不应存在有系统性的差异。每个单元具有相同被选中的机会从每个组随机抽样一个成比例的数字随机抽样分层随机抽样样本总体样本总体AABBBBCDDDAAAABBBBBBBCCDDDDDDB概率抽样每隔n个抽样(如每隔三个抽样)每经过

8、时间t抽样n个单元(例如,每小时抽样三个单元);然后计算每个小组的平均值(比例)系统抽样整群抽样样本总体或过程保持时间顺序样本过程9:009:3010:3010:00保持时间顺序统计调查的误差(抽样误差):是指调查所得结果与总体真实数值之间的差异。可分1、登记性误差:指在调查和汇总过程中,由于观察、测量、登记、计算等方面的差错或被调查者提供虚假资料而造成的误差。(不是抽样调查独有的)[尽量避免]2、代表性误差:指用样本指标推断

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。