欢迎来到天天文库
浏览记录
ID:38425193
大小:1.38 MB
页数:43页
时间:2019-06-12
《列联表、卡方检验与对数线性模型》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、列联表、c2检验和对数线性模型三维列联表(关于某项政策调查所得结果:table7.sav)观点:赞成(1)观点:不赞成(0)低收入(1)中等收入(2)高收入(3)低收入(1)中等收入(2)高收入(3)男1201055810女025157279列联表前面就是一个所谓的三维列联表(contingencytable).这些变量中每个都有两个或更多的可能取值。这些取值也称为水平;比如收入有三个水平,观点有两个水平,性别有两个水平等。该表为3×2×2列联表在SPSS数据中,表就不和课本印的一样,收入的“低”、“中”、“高”用代码1、2、3代表;性别的“女”、“男”用代码0、1代表;
2、观点“赞成”和“不赞成”用1、0代表。有些计算机数据对于这些代码的形式不限(可以是数字,也可以是字符串)。Table7.sav数据列联表列联表的中间各个变量不同水平的交汇处,就是这种水平组合出现的频数或计数(count)。二维的列联表又称为交叉表(crosstable)。列联表可以有很多维。维数多的叫做高维列联表。注意前面这个列联表的变量都是定性变量;但列联表也会带有定量变量作为协变量。二维列联表的检验研究列联表的一个主要目的是看这些变量是否相关。比如前面例子中的收入和观点是否相关。这需要形式上的检验二维列联表的检验下面表是把该例的三维表简化成只有收入和观点的二维表(这是
3、SPSS自动转化的:Analyze-DescriptiveStatistics-Crosstabs-…..).二维列联表的检验对于上面那样的二维表。我们检验的零假设和备选假设为H0:观点和收入这两个变量不相关;H1:这两个变量相关。这里的检验统计量在零假设下有(大样本时)近似的c2分布。当该统计量很大时或p-值很小时,就可以拒绝零假设,认为两个变量相关。实际上有不止一个c2检验统计量。包括Pearsonc2统计量和似然比(likelihoodratio)c2统计量;它们都有渐近的c2分布。根据计算可以得到(对于这两个统计量均有)p-值小于0.001。因此可以说,收入高低的
4、确影响观点。Pearsonc2统计量似然比c2统计量Oi代表第i个格子的计数,Ei代表按照零假设(行列无关)对第i格子的计数的期望值二维列联表的检验刚才说,这些c2统计量是近似的,那么有没有精确的统计量呢?当然有。这个检验称为Fisher精确检验;它不是c2分布,而是超几何分布。对本问题,计算Fisher统计量得到的p-值也小于0.001。聪明的同学必然会问,既然有精确检验为什么还要用近似的c2检验呢?这是因为当数目很大时,超几何分布计算相当缓慢(比近似计算会差很多倍的时间);而且在计算机速度不快时,根本无法计算。因此人们多用大样本近似的c2统计量。而列联表的有关检验也和
5、c2检验联系起来了。Fisher精确检验SPSS:Weight-Describ-crosstab-exact…[table7.sav]其中有变量性别(sex)、观点(opinion)和收入(income);每一列相应于其代表的变量的水平;每一行为一种水平的组合(共有2×3×2=12种组合(12行),而每种组合的数目(也就是列联表中的频数)在number那一列上面,这就是每种组合的权重(weight),需要把这个数目考虑进去,称为加权(weight).如果不加权,最后结果按照所有组合只出现一次来算(也就是说,按照列联表每一格的频数为1).由于在后面的选项中没有加权的机会,因
6、此在一开始就要加权.方法是点击图标中的小天平(“权”就是天平的意思),出现对话框之后点击Weightcases,然后把“number”选入即可。二维列联表情况加权之后,按照次序选Analyze-DescriptiveStatistics-Crosstabs。在打开的对话框中,把opinion和income分别选入Row(行)和Column(列);至于哪个放入行或哪个放入列是没有关系的。如果要Fisher精确检验则可以点Exact,另外在Statistics中选择Chi-square,以得到c2检验结果。最后点击OK之后,就得到有关Pearsonc2统计量、似然比c2统计量
7、以及Fisher统计量的输出了(这里的Sig就是p-值)。加权:下面为SPSS对于table7.savs数据产生的下面二维列联表相关分析的输出利用crosstabs处理三维列联表问题的SPSS选项利用crosstabs处理三维列联表问题的输出利用crosstabs处理三维列联表问题的输出利用crosstabs处理三维列联表问题的输出高维列联表和(多项分布)对数线性模型前面例子原始数据是个三维列联表,对三维列联表的检验也类似。但高维列联表在计算机软件的选项可有所不同,而且可以构造一个所谓(多项分布)对数线性模型(loglinea
此文档下载收益归作者所有