欢迎来到天天文库
浏览记录
ID:41538534
大小:584.51 KB
页数:20页
时间:2019-08-27
《关于随机性的游程检验》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、2.3关于随机性的游程检验在实际中,经常需要考虑一个序列中的数据出现是否与顺序无关,这关系到数据是否独立.几乎所有经典统计方法在理论上都要求样本是随机样本,即要求重复观察到的一组变量值在统计上相互独立。参数统计很难考察这一问题,但从非参数的角度考察时,若数据出现趋势,周期性规律,就不能表示数据是独立的。这些问题可以转化为0-1序列或类型出现顺序的随机性问题。游程检验就是检验数据出现顺序是否随机,其出发点是检验样本的独立性。一个两分的总体,如按性别区分的人群,按产品是否有毛病区分的总体等等,随机从中拍取一个样本,样本也可以分为两类:类型1和类型2.凡属类型1
2、的记做0,类型2的记做1当样本按某种顺序排列(如按抽取时间先后排列)时,一个或者一个以上相同符号连续出现的段,就被称作游程,也就是说,游程是在一个两种类型的符号的有序排列中,相同符号连续出现的段。一、游程在数据出现顺序是否随机的检验中,一个典型的序列就是二元0/1序列出现顺序的随机性问题在一个二元序列中,0和1交替出现,一个由0或1连续构成的串称为一个游程(run),一个游程中数据的个数称为游程的长度。一个序列里游程个数用R表示,R表示0和1交替轮换的频繁程度。容易看出,R是序列中0和1交替轮换的总次数加1.假如我们掷一个硬币,这是一个伯努利试验,将正面向
3、上记做1,将反面向上记做0,例如我们得到一列这样的结果:00000001111110000111100如果称连在一起的0或1为游程,则上面这组数中有3个0游程,2个1游程,一共是5个游程(R=5)这里0的总个数为m=13,1的总个数为n=10.记总的试验次数为N,有N=m+n如果0/1序列中0和1出现的顺序规律性不强,随机性强,则0和1出现不会太集中,也不会太分散。换句话说,可以通过0和1出现的集中程度度量序列随机性的大小。若序列随机,则游程的个数不能太多,也不能太少。游程长度也不应太长或太短。相应地,就会出现游程个数检验和游程长度检验。在固定序列长度m和
4、n时,可以通过游程的个数R过多或过少来定义假设检验的拒绝域。二、随机游程的检验Mood(1940)提出关于这一问题的检验假设检验:随机抽取一个样本,其观察值按某种顺序排列,如果研究所关心的问题是:被有序排列的两种类型符号是否随机排列,则可以建立双侧备择.如果关心的是序列是否具有某种倾向,则应建立单侧备择注:1.为了对假设作出判定,被收集的样本数据仅需定类尺度测量,但要求进行有意义的排序,按一定次序排列的样本观察值能够被变换为两种类型的符号(比如二元0/1序列)2.在H0为真的情况下,两种类型符号出现的可能性相等,其在序列中是交互的。相对于一定的m和n,序列
5、游程的总数应在一个范围内。若游程的总数过少,表明某一游程的长度过长,意味着许多0或许多1连在一起,序列存在成群的倾向;若游程总数过多,表明游程长度很短,意味着0和1交替出现得太频繁,序列具有混合的倾向。因此,无论游程的总数R过多或过少,都表明序列不是随机的。二、检验统计量检验统计量为:R游程个数例如,对于序列1100001110110000111100,R=8,游程长度分别为2,4,3,1,2,4,4,2极端情况:000001111111R=20101010101010R=2min(m,n)+1所以,2≤R≤2min(m,n)+1极端情况都说明数据不具有随
6、机性。那么R服从什么分布呢?R的分布三、确定p值四、总结随机性的游程检验例2.5假如我们掷一个硬币,将正面向上记做1,将反面向上记做0,例如我们得到一列这样的结果:00000001111110000111100假定在R软件中,x代表上面的数据,则游程个数可由语句N=length(x);k=1;for(iin1:(N-1))if(x[i]!=x[i+1])k=k+1得到。而“0”的个数m和“1”的个数n可由下面语句得到:m=sum(1-x);n=sum(x)五、随机性的游程检验的应用1.检验两个总体的位置参数是否相同例题:检验X和Y分布函数是否相同在我国的工
7、业和商业企业中随机抽取22家企业进行资产负债率行业差异分析,其1999年底的资产负债率(%)如下:问:两个行业的负债水平是否有显著性差异工业647655825982707561647383商业77808065939184918486顺序1234567负债率55596164646570组别11111211516171819202122828384848691919311222222解:排序寻找游程891011121314737576778080821112221如果原假设成立,则两个行业的负债水平的分布是相同的,将其混合后,应能较为充分、均匀地混合,游程数R
8、应该比较大反之当游程数R较小,则说明两个总体的分布可能不同,因此是
此文档下载收益归作者所有