欢迎来到天天文库
浏览记录
ID:48058558
大小:1.14 MB
页数:35页
时间:2019-05-06
《sas的t检验(正式).ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、学习目标掌握基本SAS过程的调用掌握单样本、配对设计资料、两独立样本t检验的基础理论及其SAS分析程序;1概述SAS系统的BASE软件提供了一些计算基础统计量的过程,如:means过程、univariate过程、ttest过程。这些过程可完成单变量或多变量的描述统计量计算。它们也可完成各种t检验。2MEANS过程MEANS过程功能是对计量数据进行统计描述与单样本或配对设计资料的t检验,它的一般格式如下:procmeans输入数据集名<选项列表>;var变量列表;class变量列表;by变量列表;freq变量;weight变量;id变量列表;output2、出数据集名><统计量关键字=变量名列表>;run;3选项列表vardef=df/weight/wgt/n/wdf——在方差计算中规定除数d.。descending——规定输出数据集按_type_值下降的次序(缺省时为上升)。order=freq/data/internal/formatted/——规定输出时class变量按所指定方式排序。alpha=数字——设置计算置信区间的置信水平,值在0与1之间。45统计量名称含义统计量名称含义n未丢失的观测个数mode众数,出现频数最高的数nmiss丢失的观测个数sumwgt权数和mean算术平均max最大值stderr均值3、的标准误差min最小值sum加权和range极差,max—minstd标准偏差median中间值var方差T总体均值等于0的t统计量cv变异系数的百分数Prtt分布的双尾p值uss加权平方和Clm置信度上限和下限css关于均值偏差的加权平方和Lclm置信度下限skewness对称性的度量——偏度Uclm置信度上限kurtosis对尾部陡平的度量——峰度统计量关键字output语句中的选项——输出数据集名。统计量关键字=变量名列表——规定在输出数据集中要包含的统计量并规定这些统计量在新数据集中的变量名。means过程对output语句的次数没4、有限制,可以使用几个output语句来创建内容不同的多个数据集。6其它语句var语句——分析的连续型变量。by语句——分组变量,须事先排序。class语句——分组变量,无须事先排序。freq语句——指定频数。weight语句——指定权重。id语句——在输出数据集中增加一个或几个附加变量,目的在于识别输出数据集里的观测。其值为生成这个观测的输入数据集中相应观测组里id变量具有的最大值。7UNIVARIATE过程UNIVARIATE过程功能是对计量数据进行更为详细的统计描述、少量统计图、正态性检验与单样本或配对设计资料的t检验,它的一般格式如下:procunivari5、ate输入数据集名<选项列表>;var变量列表;by变量列表;freq变量;weight变量;id变量列表;output<统计量关键字=变量名列表>;run;8选项列表vardef=df/weight/wgt/n/wdf——在方差计算中规定除数d.。normal——要求计算关于输入数据服从正态分布的假设的检验统计量。plot——要求生成一个茎叶图、一个盒型图和一个正态概率图。pctldef=1/2/3/4/5——规定计算百分位的五种方法,缺省值为5。910统计6、量关键字统计量名称含义统计量名称含义n未丢失的观测个数mode众数,出现频数最高的数nmiss丢失的观测个数t总体均值等于0的t统计量nobs观测个数prtt分布的双尾p值mean算术平均q3上四分位数(75%)stderr均值的标准误差q1下四分位数(75%)sum加权和qrange上下四分位数差(q3-q1)std标准偏差p11%分位数var方差p55%分位数cv变异系数的百分数p1010%分位数uss加权平方和p9090%分位数css关于均值偏差的加权平方和p9595%分位数skewness对称性的度量——偏度p9999%分位数kurtosis对尾部陡平的度7、量——峰度msign符号统计量sumwgt权数和probm大于符号秩统计量的绝对值概率max最大值signrank符号秩统计量min最小值probs大于中心符号秩统计量的绝对值prange极差,max—minnormal检验正态性的统计量median中间值probn检验正态分布假设的概率值output语句中的选项——输出数据集名。统计量关键字=变量名列表——规定在输出数据集中要包含的统计量并规定这些统计量在新数据集中的变量名。means过程对output语句的次数没有限制,可以使用几个output语句来创建内容不同的多个数据集。11其它语句8、var语句
2、出数据集名><统计量关键字=变量名列表>;run;3选项列表vardef=df/weight/wgt/n/wdf——在方差计算中规定除数d.。descending——规定输出数据集按_type_值下降的次序(缺省时为上升)。order=freq/data/internal/formatted/——规定输出时class变量按所指定方式排序。alpha=数字——设置计算置信区间的置信水平,值在0与1之间。45统计量名称含义统计量名称含义n未丢失的观测个数mode众数,出现频数最高的数nmiss丢失的观测个数sumwgt权数和mean算术平均max最大值stderr均值
3、的标准误差min最小值sum加权和range极差,max—minstd标准偏差median中间值var方差T总体均值等于0的t统计量cv变异系数的百分数Prtt分布的双尾p值uss加权平方和Clm置信度上限和下限css关于均值偏差的加权平方和Lclm置信度下限skewness对称性的度量——偏度Uclm置信度上限kurtosis对尾部陡平的度量——峰度统计量关键字output语句中的选项——输出数据集名。统计量关键字=变量名列表——规定在输出数据集中要包含的统计量并规定这些统计量在新数据集中的变量名。means过程对output语句的次数没
4、有限制,可以使用几个output语句来创建内容不同的多个数据集。6其它语句var语句——分析的连续型变量。by语句——分组变量,须事先排序。class语句——分组变量,无须事先排序。freq语句——指定频数。weight语句——指定权重。id语句——在输出数据集中增加一个或几个附加变量,目的在于识别输出数据集里的观测。其值为生成这个观测的输入数据集中相应观测组里id变量具有的最大值。7UNIVARIATE过程UNIVARIATE过程功能是对计量数据进行更为详细的统计描述、少量统计图、正态性检验与单样本或配对设计资料的t检验,它的一般格式如下:procunivari
5、ate输入数据集名<选项列表>;var变量列表;by变量列表;freq变量;weight变量;id变量列表;output<统计量关键字=变量名列表>;run;8选项列表vardef=df/weight/wgt/n/wdf——在方差计算中规定除数d.。normal——要求计算关于输入数据服从正态分布的假设的检验统计量。plot——要求生成一个茎叶图、一个盒型图和一个正态概率图。pctldef=1/2/3/4/5——规定计算百分位的五种方法,缺省值为5。910统计
6、量关键字统计量名称含义统计量名称含义n未丢失的观测个数mode众数,出现频数最高的数nmiss丢失的观测个数t总体均值等于0的t统计量nobs观测个数prtt分布的双尾p值mean算术平均q3上四分位数(75%)stderr均值的标准误差q1下四分位数(75%)sum加权和qrange上下四分位数差(q3-q1)std标准偏差p11%分位数var方差p55%分位数cv变异系数的百分数p1010%分位数uss加权平方和p9090%分位数css关于均值偏差的加权平方和p9595%分位数skewness对称性的度量——偏度p9999%分位数kurtosis对尾部陡平的度
7、量——峰度msign符号统计量sumwgt权数和probm大于符号秩统计量的绝对值概率max最大值signrank符号秩统计量min最小值probs大于中心符号秩统计量的绝对值prange极差,max—minnormal检验正态性的统计量median中间值probn检验正态分布假设的概率值output语句中的选项——输出数据集名。统计量关键字=变量名列表——规定在输出数据集中要包含的统计量并规定这些统计量在新数据集中的变量名。means过程对output语句的次数没有限制,可以使用几个output语句来创建内容不同的多个数据集。11其它语句
8、var语句
此文档下载收益归作者所有