欢迎来到天天文库
浏览记录
ID:36594450
大小:1.24 MB
页数:98页
时间:2019-05-09
《SAS04__SAS基本统计分析功能》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第4章SAS基本统计分析功能返回目录4.1假设检验4.2回归分析4.3方差分析4.4属性数据分析返回4.1假设检验正态性检验(univariate过程)单样本均值的T检验(univariate过程)两独立样本均值检验(TTest过程par1way过程)两相关样本均值检验(Univariate过程)返回4.1.1正态性检验(univariate过程)1.背景原理:正态分布是一种最常见的连续型分布它以均值为对称轴呈对称的钟型分布。检验的零假设Ho:数据资料服从正态分布。备择假设H1:数据资料不服从正态分布。当样本量n≤2000时,应选用shapiro-wilk检验法,检验统计量为W值越接近于1
2、,P值越大,表明资料越服从正态分布当n>2000时,应用Kolmogorov-smirnov检验法,检验统计量为D值越小,P值越大,表明资料越服从正态分布。2.举例在procunivariate语句中加上normal选项可以进行正态性检验。【例1】检验数据集sasuser.gpa中变量gpa是否服从正态分布?输出结果中正态检验部分为:分析:检验的零假设为Ho:gpa变量服从正态分布,其中shapiro-wilk检验的统计量为w=0.966294,检验的p值小于0.0001,当然小于给定的显著性水平α=0.05,故应拒绝零假设,即有95%把握认为gpa非正态。说明:使用SAS软件中的“分析家”,
3、打开数据集后,利用菜单“统计”→“描述性统计”→“分布”,除了可以检验变量是否服从正态分布外,还可以检验对数正态、指数和韦布尔分布。4.1.2单样本均值的T检验(univariate过程)1.原理背景设总体X~N(μ,σ2),μ、σ2未知,给定检验水平α,对常数μ0要检验零假设为设X1,X2,…Xn为X的简单随机样本,在H0成立时有其中S为变量的标准差,n为样本量。检验的拒绝域为:补充P值检验法:分位数t1-α/2(n-1)满足Pr{
4、t
5、>t1-α/2(n-1)}=α设由已经得到的样本具体计算得到的t值为t0,若
6、t0
7、>t1-α/2(n-1),则拒绝H0,否则接受H0。对大量重复试验而言,
8、t是随机变量,且服从t分布t(n-1)。当
9、t0
10、11、t12、>t0}>Pr{13、t14、>t1-α/2(n-1)}=α反之亦然。令p=Pr{15、t16、>t0},则17、t018、α所以,假设检验的p值方法为:对给定的显著水平α,当p<α时,拒绝H0,当p>α时,接受H02.应用举例在SAS中用univariate过程默认进行某个变量均值为零(μ0=0)的t检验,若要检验μ=μ0,则需进行变量代换。例2:检验数据集sasuser.class中学生的身高均值与63有无显著性差异。输出结果为:分析:先作正态性检验。Ho:变量y服从正态分布,其中shap19、iro-wilk检验的统计量为w=0.979083,检验的p值=0.9312>α=0.05,故应接受零假设,即有95%把握认为变量y正态。故采用单样本均值T检验。对变量y的零假设为Ho:μ0=0。由输出结果知T检验的统计量t=-0.5638,双边检验的p值为0.5798>α=0.05,故接受原假设,即有95%的把握接受学生的平均身高为63。说明:当变量服从正态分布时,优先采用t检验,当变量服从非正态时,可以采用符号秩(signedRank)检验,符号检验(sign)的检验功效较差,一般不常用它。对同一问题不同的检验方法一般是一致的,但有时也有互相矛盾的结果。使用SAS软件中的分析家,打开数据集20、后,利用菜单“统计”→“假设检验”→“均值的单样本T检验”可以进行双边和单边检验。4.1.3两独立样本均值检验(TTest过程、npar1way过程)1.原理背景假设两组样本来自两个独立总体,需要检验两个总体的均值或中心位置是否一样。如果两个总体都服从正态分布,则可使用两独立样本均值的T检验。两个样本方差相等与不相等时使用的检验统计量是不一样的,所以应该先对方差的齐性进行检验。设两个样本的均值为,方差为,观测量为有关公式如下:方差齐性检验的零假设为H0:两个独立样本的来自方差相等的总体,即,检验统计量为4.1.3两独立样本均值检验(TTest过程、npar1way过程)方差齐时,检验两样本的均21、值是否相同的零假设为H0:两个独立样本的来自均值相等的总体,即,检验统计量为其中为合并方差。方差不齐时,检验两样本的均值是否相同,用校正t检验。检验零假设为H0:两个独立样本的来自均值相等的总体,即,检验统计量为2.Ttest过程格式:PROCTTEST[选项];CLASS变量名;VAR变量名;BY变量名;RUN;说明:(1)proc语句中的“选项”有:Data=数据集,指明要分析的数据集;Coc
11、t
12、>t0}>Pr{
13、t
14、>t1-α/2(n-1)}=α反之亦然。令p=Pr{
15、t
16、>t0},则
17、t0
18、α所以,假设检验的p值方法为:对给定的显著水平α,当p<α时,拒绝H0,当p>α时,接受H02.应用举例在SAS中用univariate过程默认进行某个变量均值为零(μ0=0)的t检验,若要检验μ=μ0,则需进行变量代换。例2:检验数据集sasuser.class中学生的身高均值与63有无显著性差异。输出结果为:分析:先作正态性检验。Ho:变量y服从正态分布,其中shap
19、iro-wilk检验的统计量为w=0.979083,检验的p值=0.9312>α=0.05,故应接受零假设,即有95%把握认为变量y正态。故采用单样本均值T检验。对变量y的零假设为Ho:μ0=0。由输出结果知T检验的统计量t=-0.5638,双边检验的p值为0.5798>α=0.05,故接受原假设,即有95%的把握接受学生的平均身高为63。说明:当变量服从正态分布时,优先采用t检验,当变量服从非正态时,可以采用符号秩(signedRank)检验,符号检验(sign)的检验功效较差,一般不常用它。对同一问题不同的检验方法一般是一致的,但有时也有互相矛盾的结果。使用SAS软件中的分析家,打开数据集
20、后,利用菜单“统计”→“假设检验”→“均值的单样本T检验”可以进行双边和单边检验。4.1.3两独立样本均值检验(TTest过程、npar1way过程)1.原理背景假设两组样本来自两个独立总体,需要检验两个总体的均值或中心位置是否一样。如果两个总体都服从正态分布,则可使用两独立样本均值的T检验。两个样本方差相等与不相等时使用的检验统计量是不一样的,所以应该先对方差的齐性进行检验。设两个样本的均值为,方差为,观测量为有关公式如下:方差齐性检验的零假设为H0:两个独立样本的来自方差相等的总体,即,检验统计量为4.1.3两独立样本均值检验(TTest过程、npar1way过程)方差齐时,检验两样本的均
21、值是否相同的零假设为H0:两个独立样本的来自均值相等的总体,即,检验统计量为其中为合并方差。方差不齐时,检验两样本的均值是否相同,用校正t检验。检验零假设为H0:两个独立样本的来自均值相等的总体,即,检验统计量为2.Ttest过程格式:PROCTTEST[选项];CLASS变量名;VAR变量名;BY变量名;RUN;说明:(1)proc语句中的“选项”有:Data=数据集,指明要分析的数据集;Coc
此文档下载收益归作者所有