交叉列联表分析【精选】

交叉列联表分析【精选】

ID:43784207

大小:131.12 KB

页数:5页

时间:2019-10-14

交叉列联表分析【精选】_第1页
交叉列联表分析【精选】_第2页
交叉列联表分析【精选】_第3页
交叉列联表分析【精选】_第4页
交叉列联表分析【精选】_第5页
资源描述:

《交叉列联表分析【精选】》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、交叉列联表分析用于分析属性数据1.属性变量与属性数据分析从变屋的测暈水平來看分为两类:连续变暈和属性(Categorical)变量,属性变暈又可分为有序的(Ordinal)和无序的变量。对属性数据进行分析,将达到以下几方面的H的:1)产生汇总分类数据——列联农;2)检验属性变量间的独立性(无关联性);3)计算屈性变量间的关联性统计量;4)对高维数据进行分层分析和建模。在实际屮,我们经常遇到判断两个或多个属性变量Z间是否独立的问题,如:吸烟与患帅癌是否冇关?色盲与性别是否冇关?上网时间与学习成绩是否冇关等等.解决这类问题常用到建立列联表,利用z2统计量作显著

2、性检验來完成.2.列联表(ContingencyTable)列联表是山两个以上的属性变量进行交叉分类的频数分布表。设二维随机变量(X,Y),X可能取得值为xi,兀2,…,兀,Y可能取得值为刃,)勺,•••,)*•现从总体中抽取容量为n的样木,其中事件(X二如Y=y.)sr发生的频率为弘j(i=1,2,…,r,j=1,2,…,s,)记I.二工弘j,"・/=》/?□,j=1=1rsrs则有»"j,将这些数据排列成如下的表:/=!7=1/=1;=1这是一张rxs列联表•1.属性变量的关联性分析对于不同的属性变量,从列联表中可以得到它们联合分布的信息。但有时还想

3、知道形成列联农的行和列变量间是否有某种关联性,即-■个变量取不同数值时,另一•个变量的分布是否有显著的不同,这就是属性变量关联性分析的内容。属性变暈关联性检验的假设为H0:变量Z间无关联性:H1:变量之间有关联性山于变量之间无关联性说明变最互相独立,所以原假设和备择假设可以写为:H0:变量之间独立;H1:变量之间不独立力2检验h0:x与丫独立.记n=j)=P:j>/=1,2,…,r,,j=1»2,…,s,P(X=^)=P.(,Z=l,2,…,r,P(Y=yj)=pj,)=1,2,…,s.由离散性随机变暈相互独立的定义,则原假设等价于若耳j已知,我们可以建立

4、皮尔逊力2统汁量由皮尔逊定理知,力'的极限分布为z2(r5-l).但这里S耒知,因此用它A的极人似然估计Pij代替,这时检验统计屋为(八¥r?llij-八D)=PHi==1在H。成立的条件下,P(j=p.pj,即等价于用p•和亿j的极人似然估计AAPj•和p.j的积去代替.可以求得rii.n.jn从而得到统计量(AArej~nnn匸1V=lAAnPi.p.j(2/=!ij=Hi•n.j-1在H()成立的条件下,当n—8时,力2的极限分布为才(◎-(+-2)-1上Z2((r-1)(5-1)).对给定的显著性水平a,当*>力莒((厂一1)($一1)),

5、则拒绝Ho,否则接受H°.特别,当r=s=2时,得到2X2列联表,常被称为四格表,是应用最广的一种列联表.这时检验统汁量为七2(川1/122—⑵2/121)X=nn.i.n.n.i它的极限分布为力$(1).对于二维随机变量(X,Y)是连续取值的情况,我们可采用如下方法将其离散化.①将X的取值范围(-8,+<-)分成I•个互不相交的区间,将Y的取值范围(.8,+8)分成S个互不和交的区间,于是整个平面分成了rs个互不相交的小矩形;②求出样本落入小矩形中的频数mji=1»2,…,r,J=I,2,…,s;③建立统计暈(2、Z2=n£f-1,i-Uj=im^

6、n^/J/在H()成立时且n充分大时,力'的极限分布为力2((厂一1)($—1)),拒绝域的确定同离散型的情况.3.属性变量的关联度计算力2检验的结果只能说明变量Z间是否独立,如果不独立,并不能由力$的值说明它们Z间关系的强弱,这可以由(P系数來说明0系数hnwnii-n2m其它其中当r=s=2U

7、J2X2列联表时JV0V1,其它Ov0vl,10越接近1,它们Z间关联性越强,反Z越弱。主要用于2X2列联表例1(教材pll6例4.4)为了了解吸烟与患慢性气管炎的关系,对339名50岁以上的人作了调查,貝体数拥如下表:患病ifl及烟、患病未患病合计吸烟4

8、3162205不吸烟13121134合计56283339利川交义列连农分析,研究吸烟习惯与患慢性气管炎的关系。解检验Ho:吸烟与患慢性气管炎无关.已给数据构成一个四格表,n=339,nn=43>n12=162,n217222=121,nle=205,n<1=13,n2>=134,川.2=121,则(〃1"222—71127221)339x(43x121-162x13)2%=n-="469・n.2・zii.n.213x134x205x121若给定a=0.05,查表得力爲5(1)=3.841<7.469,所以拒绝H(),即认为吸烟习惯与患慢性气管炎冇关.但

9、/系数=0.148较小,衣示相关性不是太人利用SPSS软件完成练习

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。