欢迎来到天天文库
浏览记录
ID:52363725
大小:451.00 KB
页数:25页
时间:2020-04-04
《同济医学院-《SAS》课件-求基本统计量过程.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、求基本统计量过程ProcedureofdescriptivestatisticsSAS应用蒋红卫Email:JHWCCC@21CN.COM程序选择计量资料描述性研究集中趋势:meanmedian离散程度:stdvarianceCVrange分布检验(正态性检验)计数资料描述性研究率(rate)构成比(propotion)比(ratio)MEANS过程UNIVARIATE过程过程名FREQ过程三个求基本统计量过程Means过程Univariate过程Freq过程一.MEANS过程用于计量资料(numericaldata)描述性分析。求均数(mean)、
2、标准差(standarddeviation)、最大值(maximum)、最小值(minimum)等基本统计量,产生包含统计结果的数据集以便作为其他过程的输入数据集。1.功能2.格式PROCMEANS<选择项><关键字>;VAR变量…;FREQ变量…;ID变量…;BY变量…;OUTPUT选择项;3.语句说明:1、PROCMEANS语句PROCMEANS<选择项><统计关键字选择项>;1)选择项包括:DATA=SAS数据集指明需做MEANS分析的SAS数据集名。ALPHA=n指定计算可信限的α值,缺省α=0.05。NOPRINT不打印统计值,仅建立一个新
3、数据集。MAXDEC=n输出结果取n位小数,缺省值为7。VARDEF=DF计算方差时的除数是自由度(N-1)。=N计算方差时的除数是观测数。PROCMEANS<选择项><统计关键字选择项>;N无缺省值的观察数MEAN均值STD标准差MIN最小值MAX最大值RANGE极差SUM所有不缺省项变量值的和VAR方差USS未修正的平方和CSS修正的平方和CV变异系数2)统计关键字选择项STDERR标准误T总体均值为0的学生t值PRTt值的最大绝对值的概率SKEWNESS偏度KURTOSIS峰度CLM上下可信限值LCLM可信限下限值UCLM可信限上限值2)统计关
4、键字选择项3)缺省时,自动地为每个数值型变量输出五个统计量:N、MIN、MAX、MEAN、STD。2、主要语句(1)VAR语句:指明需要计算均数等统计量的变量。如果求多个变量的统计量,多个变量之间用空格分开,列于VAR之后。如果不加此语句,则MEANS过程对数据集中所有数值型变量进行计算;(2)FREQ语句:指明频数处理变量(3)ID语句:输出的数据集包含该语句所指的变量(4)BY语句:指明用以分组统计的变量。使用BY语句之前,数据集一定按BY语句中的变量排过序。(5)OUTPUT语句:产生包含有基本统计值的数据集OUTPUT语句OUTPUTOUT=
5、SAS数据集统计关键字=变量名清单;功能:将MEANS过程产生的统计值输出到一个新的SAS数据集。1.OUT=SAS数据集指定计算结果放入新的数据集里。2.统计关键=变量名清单指明新数据集中想要的统计项,并给包含这些统计项的变量起名,这些名字将作为统计值在新数据集中使用。统计关键字为<统计关键字选择项>的任意统计量,变量名清单为VAR语句中的变量名,可以取一个,也可以取多个。需要注意的是,LCLM,UCLM(同时指定输出为双侧;如只选一个,输出单侧可信区间)可以重新对统计量命名,也可用原名;格式n=nmean=meanprt=p例1:PROCSORT
6、DATA=CLASS1;BYSEX;PROCMEANSDATA=CLASS1;VARHEIGHT;BYSEX;RUN;PROCMEANSDATA=CLASS1;VARHEIGHT;OUTPUTOUT=NEWMEAN=MEANHEIGHT;RUN;Datagmean;Inputx@@;Y=log10(x);Cards;2530323428Procmeansnoprint;Vary;Outputout=gmean1mean=y1;Datagmean2;Setgmean1;X1=10**y1;Procprint;Varx1;Run;例2例16-2某地区19
7、53至1957年人口的自然增长率为25‰、30‰、32‰、34‰、28‰,求平均增长率。二.UNIVARIATE过程1.格式:PROCUNIVARIATE[data=SAS数据集]normalplot;VAR变量…;FREQ变量…;ID变量…;OUTPUTOUT=datasetkeyword=name;2.功能:求数据集中某(些)变量均数(mean)百分位数(percentiles)、极值(extremes)等基本统计量。与MEANS过程的区别在于它可以计算更多的反应数据分布的统计量。Normal:用于正态性检验。Plot:给出干叶图、箱式图及正态概
8、率图,检验数据是否服从正态分布。例2:测定30名正常男子血浆中性脂肪含量(mg/lwml)的结果如下:163
此文档下载收益归作者所有