秒表测时法—数据处理:格拉布斯准则剔除异常值

秒表测时法—数据处理:格拉布斯准则剔除异常值

ID:37780351

大小:60.00 KB

页数:5页

时间:2019-05-31

秒表测时法—数据处理:格拉布斯准则剔除异常值_第1页
秒表测时法—数据处理:格拉布斯准则剔除异常值_第2页
秒表测时法—数据处理:格拉布斯准则剔除异常值_第3页
秒表测时法—数据处理:格拉布斯准则剔除异常值_第4页
秒表测时法—数据处理:格拉布斯准则剔除异常值_第5页
资源描述:

《秒表测时法—数据处理:格拉布斯准则剔除异常值》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、秒表测时法——数据处理:根据格拉布斯准则剔除异常值——宋楠   使用秒表测时法来确定某一作业单元(工序、工步或操作、动作,下同)的时间消耗,我们一般要针对该作业单元现场实测多个周期,由此获得一组测时数据(实测时间原始值),然后运用统计方法对这一组数据作出适当处理,并依据处理结果(实测时间有效值)来确定该作业单元时间消耗的一个代表值(实测时间代表值),最后通过工时评定对该代表值加以修正,才能获得该作业单元的正常作业时间(Tz),以之为基础加上必要的宽放就可以最终获得标准工时[(T=Tz(1+k)]。   运用统计方

2、法对一组测时数据进行“适当处理”的步骤大体有四:   1)判断这组数据(整体)是否稳定——否则需要重新测时;   2)判断每个数据(个体)是否正常——否则需要予以剔除;   3)判断数据组剩余时间值的数量(或者说测时次数)是否足够——否则需要进行补测;   4)确定数据组的代表值——确定这一组实测时间的代表值,即该作业单元时间消耗的实测代表值。通常取各剩余时间值的平均数(或中位数或众数)。注意此时数据组中的数据是通过前三步骤处理后的余留数据,其个数不一定与原始数据组的时间值个数相同,既可能因剔除了异常值而减少了,

3、也可能由于补测而增多了。   在上述数据处理过程中,时间数据的转化情况示意如下:      现场实测: 实测时间原始值(一组,整体可能不稳定、个体可能有异常且数量可能不足)    数据处理:A.实测时间有效值(一组,与原始数据的个数不一定相同)             B.实测时间代表值(一个)    工时评定: 正常作业时间(一个)   “适当处理”的第二个步骤(判断每个数据是否正常,亦即剔除异常值)的所用方法,目前我国劳动定额的相关资料主要介绍了拉伊达准则(三倍标准差法),这种方法简单方便,无需查表,适合测量

4、次数较多因而测时数据服从正态分布的情况。当测量次数较少(n=20-100)时,拉依达准则可靠性下降,这时可以采用格拉布斯准则。当测量次数更少(n为10次以下)时,测时数据将更接近t分布而不是正态分布,相应可以采用罗曼诺夫斯基准则。本文谨介绍格拉布斯准则剔除异常值的完整步骤。   在一组测时数据中,如果个别(或少数)数据(即时间值,下同)偏离这组数据的中心(由平均值确定)很远,而呈现出较大的离群倾向,那么可以暂时视之为该数据组中的“可疑值”(可能属于异常的时间值)。如果进一步用统计方法能将该“可疑值”从该组数据中剔

5、除,那么该“可疑值”就确实是该组数据中的“异常值”——不应允许它或它们(一个或几个时间值)继续作为数据组成员参与后续处理或数据组代表值的计算。   我们可将一组测时数据按照从小到大的次序进行排列,得到一个升序数列,若该组测时数据之中存在有异常值,必然位于这个升序数列的两侧处。这样,对于任意一组测时数据,其可能存在的异常值的分布,可以归纳为下述三种情形:   1)仅有异常小值(不一定唯一),异常值位于升序数列左侧;   2)仅有异常大值(不一定唯一),异常值位于升序数列右侧;   3)既有异常小值又有异常大值(也不

6、一定仅仅各一),异常值位于升序数列两侧。   现假定对某工序的某一作业要素进行秒表测时,获得了一组共十个实测时间值:8.2、5.4、14.0、7.3、4.7、9.0、6.5、10.1、7.7、6.0(min),假定数据组的稳定性合乎要求,现采用格拉布斯法判断并剔除其中可能的异常值的步骤如下:   1.对数据组作升序排列,得:    4.7、5.4、6.0、6.5、7.3、7.7、8.2、9.0、10.1、14.0。   可以肯定,初步的可疑值位于数列的两侧,不是最小值(左侧的4.7)就是最大值(右侧的14.0)。

7、   2.计算数据组的平均值µ和标准差σ:    1)平均值:µ=(4.7+5.4+...+14.0)/10=7.89;    2)标准差:σ=2.704   3.计算可疑数据的偏离值——以平均值为基准:    1)最大值与平均值之差:14.0-7.89=6.11    2)平均值与最小值之差:7.89-4.7=3.19   4.确定一个可疑值——具有最大偏离值的数据:    ∵6.11>3.19    ∴最大值14.0是可疑值。   注:这里先将偏离值较大者作为最可能的异常值,还只是怀疑而已,还需经过下面的定量

8、判断才能确认。此外,如果偏离值较小者也是异常值,或者数列两端以内还存在有异常值,按照下面的步骤,并不会放过。   5.计算Gi值——公式:Gi=残差/标准差=(Xi-µ)/σ,亦即等于残差与标准差的比值。    G10=(X10-µ)/σ=(14.0-7.89)/2.704=2.260    其中i是可疑值在升序数列中的排列序号,本例为第10号数据14.0,i=10。  

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。