欢迎来到天天文库
浏览记录
ID:55324369
大小:632.00 KB
页数:16页
时间:2020-05-10
《SAS备课笔记_非参数检验.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、非参数检验非参数统计分析方法(Non-parametricstatistics)是相对参数统计分析方法而言的,又称为不拘分布(distribution-freestatistics)的统计分析方法或无分布形式假定(assumptionfreestatistics)的统计分析方法。其中包括Wilcoxon秩和检验、Kruskal-Wallis秩和检验、friedman秩和检验等,它们分别对应不同设计类型的资料。SAS中对于非参数分析方法功能的实现主要由npar1way过程来完成,从过程名字就可以看出,在此过程的处理进程中,只能
2、一次指定一个因素进行分析。下面我们先来了解一下npar1way过程的语句格式以及各语句和选项的基本功能。一、npar1way过程语句格式简介npar1way过程属于SAS的STAT模块,对于统计学教科书上所涉及的非参数统计方法几乎都可以通过此过程来完成。Npar1way过程的基本语句格式如下。PROCNPAR1WAY<选项>;BY变量名;CLASS变量名;EXACT统计量选项运算选项>;FREQ变量名;OUTPUT<选项>;VAR变量名;RUN;QUIT; Procnpar1way语句标志npar1w
3、ay过程的开始,默认情况下(不列举任何选项):npar1way过程对最新创建的数据集进行分析,将缺失数据排除在分析过程之外;执行方差分析过程(等同于ANOVA选项),对样本分布位置的差异进行检验(与选项WILCOXON,MEDIAN,SAVAGE以及VW等效),并进行经验分布函数检验(等同于EDF选项)。此语句后可用的选项见下表。Procnpar1way语句选项及其含义选项名称选项功能或含义AB运用Ansari-Bradley评分进行分析DATA=数据集名指定要进行分析的数据集MEDIAN运用中位数评分进行分析,即进行中位数
4、检验NOPRINT禁止所有的输出,用在仅需要创建输出数据集时ST运用Siegel-Tukey评分进行分析ANOVA对原始数据进行方差分析EDF要求计算基于经验分布的统计量MISSING指定分组变量的缺失值为一有效的分组水平SAVAGE运用Savage评分进行分析VW运用VanderWaerden评分进行分析计算CORRECT=NO在两样本时,禁止Wilcoxon和Siegel-Tukey检验的连续性校正过程KLOTZ运用Klotz评分进行分析MOOD运用Mood评分进行分析SCORES=DATA以原始数据为评分值进行分析WI
5、LCOXON对两样本进行Wilcoxon秩和检验,对多样本进行Kruskal-Wallis检验1.exact语句exact语句要求SAS对指定的统计量(选项)进行精确概率的计算。其后的统计量选项可为以下项目,分别对应相应的统计计算方式(可参见上表)。AB,KLOTZ,KS,MEDIAN,MOOD,SAVAGE,SCORES=DATA,ST,WILCOXON,VW等。运算选项为精确概率的计算过程指定一些控制项目,如选项“mc”要求以MonteCarlo方法计算精确概率。2.output语句output语句与其它过程中相应的语句
6、大同小异,不同之处在于语句最后的选项。此处的选项绝大多数包括在上表中,指定在输出数据集中包含所指定项目所对应的统计量。3.var语句var语句用以指定要进行分析的变量,变量必须为数值型。若省略此语句,SAS将对除by语句、class语句以及freq语句中指定的变量之外的所有数值型变量进行分析。二、不同类型资料的非参数检验方法1.两独立样本差别的秩和检验两独立样本的非参数检验是在对总体分布不了解的情况下,通过分析样本数据,推断样本来自的两个独立总体的分布是否存在显著差异,一般来说是推断两个独立总体的均值或中位数是否存在显著差异
7、。关于样本是否为独立的,主要看在一个总体中抽取样本对在另一个总体中抽取样本有无影响。如果没有影响,则可以认为这两个总体是独立的。零假设:样本来自的两独立总体的分布没有显著差异检验方法有多种:(1)两独立样本的威克逊等级和检验(Wilcoxon秩和检验),也被称为Mann-WhitneyU检验。曼-惠特尼U检验(Mann-WhitneyU),该检验主要是通过对平均秩的研究来实现推断的。其基本思路是:首先,将两组样本数据和混合并按升序排序(m和n分别为两组样本的样本容量,求出每个数据各自的秩;然后,分别对和的秩求平均,得到两个平
8、均秩和,如果这两个平均秩相差甚远,则倾向于拒绝零假设。(2)两独立样本的K-S检验(Kolmogorov—SmirnovZ),该检验首先将两组样本混合并按升序排序;然后,分别计算两组样本秩的累计频数和每个点上的累计频率;最后,将两个累计频率相减,得到差值序列数据。(3)沃尔德—沃尔福威茨游
此文档下载收益归作者所有