欢迎来到天天文库
浏览记录
ID:42011601
大小:549.00 KB
页数:39页
时间:2019-09-06
《同济医学院-《SAS》课件-SAS的卡方检验(正式)》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、卡方检验SAS应用蒋红卫Email:JHWCCC@21CN.COM学习目标掌握四格表普通卡方检验和配对卡方检验方法以及相应的SAS程序;了解FREQ过程语句格式;熟悉R×C表资料的分类类型以及相应的统计检验方法;掌握双向无序R×C表资料检验以及SAS程序;掌握单向有序R×C表资料检验以及SAS程序;掌握趋势卡方检验方法以及SAS程序;掌握分层R×C表的分析以及SAS程序;概述前面已介绍了两个率比较的检验,在观察例数不够大或拟对多个率进行比较时,检验就不适宜了,因为直接对多个样本率作两两间的检验有可能增加第一类误差。2检验可解决此类问题。卡方检验是用途很广的一种假设检
2、验方法,这里我们主要学习它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。四格表资料定性指标分为有序的(如:疗效分为“治愈、显效、好转、无效、死亡”)和名义的(如:血型分为“O、A、B、AB”型)2类,对于每1个受试者来说,有序指标的观测结果只能是该有序指标若干等级中的1级(如某人的疗效为“显效”);名义指标的观测结果只能是该名义指标若干标志中的1个(如某人的血型为B型),显然,无法像处理定量指标那样去直接分析定性指标,故这类资料常被整理成列联表的形式后再进行分析。当表中只有2个定性指标时,
3、称为2维列联表;有3个或3个以上定性指标时,称为多维列联表。常用R、C表示2维列联表的行数和列数,并称为R×C表;当R=C=2时,称为2×2表(或四格表)。2×2表看起来很简单,但根据资料所具备的条件有许多不同的处理方法。四格表卡方检验的SAS程序在SAS/STAT模块中FREQ、TABULATE和SUMMARY等过程可用于分类资料的统计描述,其中FREQ过程兼具统计描述和统计推断的功能,对分类变量计算频数分布,产生从一维到n维的频数表和列联表;对于二维表,可进行2检验,对于三维表,可作Mentel-Hanszel分层分析。FREQ过程是SAS用于分析分类资料的一个
4、常用过程。本节将先向大家介绍FREQ过程的语句及其格式。FREQ过程的语句基本格式如下:Procfreqdata=order=;Table分类变量*分类变量/;Weight变量;Run;四格表卡方检验的SAS程序DATA=数据集:规定PROCFREQ语句使用的数据集;ORDER=FREQ,按频数递减顺序排列;ORDER=DATA,按数据集中出现的顺序排列;ORDER=INTERNAL,按内部值排列(缺省);ORDER=FORMATTED,按外部格式值排列;Table语句指定构成表格的变量和表格结构。表格的结构由变量个数和变量排列顺序决定,一个tab
5、le语句允许列出多个表格结构。PROCFREQ过程中可有多条TABLES语句,TABLES语句后可接多个表格请求式,每个请求式可包含任何数量的变量,从而得到所需的表格。四格表卡方检验的SAS程序如果TABLES语句缺省,则FREQ过程对数据集中的所有变量都给出相应的一维频数表。不规定任何选项时,若需某变量的一维频数,FREQ给出该变量每一水平的频数、累积频数、频数的百分比和累积百分比;若需二维频数表,FREQ产生交叉分组列表,即包括各格的频数、总频数的格百分数、行频数的格百分数和列频数的格百分数。请求式由一个或多个用“*”连接起来的变量名组成。几个变量可放在括号中,如
6、:TABLESA*(BC);等价于TABLESA*BA*C;TABLES(A-C)*D;等价于TABLESA*DB*DC*D;四格表卡方检验的SAS程序下列选项可用于TABLES语句中“/”的后面:OUT=数据集:建立一个包含变量值和频数计数的输出数据集。如果TABLES语句中不止一个请求式,数据集的内容相应于TABLES语句中最后一个请求。CHISQ对每层作c2检验,包括Pearsonc2、似然比c2和Mantel-Haenszelc2。此外还给出与c2检验有关的关联指标包括Phi系数、列联系数和Cramer’sV。对于2×2表,给出Fisher精确概率。AGREE
7、进行配对c2检验。EXACT对大于2×2的列联表计算Fisher精确概率。同时也给出CHISQ选项的全部统计量。四格表卡方检验的SAS程序MEASURES对每层的二维表计算一系列关联指标及相应的标准误,包括Pearson和Spearman相关系数,以及Gamma和Kendall系数等。对于2×2表,还给出常用的危险度指标及其标准误。CMH给出Cochran-Mantel-Haenszel统计量,可检验在调整了TABLES语句中其它变量后,行变量与列变量之间的关联程度。对于2×2表,FREQ过程给出相对危险度估计及其可信区间,还给出各层关联度指标是否齐
此文档下载收益归作者所有