第四讲 SAS的描述统计ppt课件.ppt

第四讲 SAS的描述统计ppt课件.ppt

ID:59009257

大小:234.00 KB

页数:33页

时间:2020-09-26

第四讲 SAS的描述统计ppt课件.ppt_第1页
第四讲 SAS的描述统计ppt课件.ppt_第2页
第四讲 SAS的描述统计ppt课件.ppt_第3页
第四讲 SAS的描述统计ppt课件.ppt_第4页
第四讲 SAS的描述统计ppt课件.ppt_第5页
资源描述:

《第四讲 SAS的描述统计ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、SAS提供多个不同的过程步来实现统计量的计算,它们在功能范围上有许多的重复,本段介绍计算常用统计量的三个过程:1.MEANS常用来计算数值型变量的均值、标准差等统计量。2.UNIVARIATE常用来计算数值型变量的均值、标准差等统计量、绘制一些统计图3.FREQ常用来计算分类变量取值的频数2.3编程实现描述性统计计算1、MEANS过程(均值过程)Procmeans<选项><输出统计量关键字列表>;;>Run;Procmeans主语句选项:1.DA

2、TA=SAS数据集指出SAS数据集的名称,若省略,则使用最近产生的数据集。2.MAXDEC=数字指定该过程输出结果中小数部分的最大位数(0到8).默认是8。3.ALPHA=置信水平为1-.默认为=0.05.Means过程默认输出统计量只有五个:N,Mean,Std,Min,Max(1)语法格式(2).应用举例例3:某单位对100名健康的女大学生测定了血清总蛋白含量(g/L),试做单变量描述性统计分析。dataaa;inputx@@;cards;74.378.8……70.4;procmeans;run;procmeansmaxdec=2nminmaxmeanst

3、dstderrcv;run;MEANS过程分析变量:xN均值标准偏差最小值最大值10073.66000003.940081564.300000084.3000000procmeans;默认的5个统计量其SAS输出结果与说明procmeansmaxdec=2nminmaxmeanstdstderrcv;输出结果:MEANS过程分析变量:xN最小值最大值均值标准偏差标准误差偏差系数10064.3084.3073.663.940.395.35例4下表为两个不同地区居民家庭收入和支出情况的抽样调查(单位:元),试分别统计收入和支出情况。将下表中数据输入成Excel文件sry

4、zc.xls。4个变量名分别为:ID、R_ID、Income和Outgo,该四个变量分别表示“家庭编号”、“地区编号”、“家庭总收入”和“家庭总支出”。首先将其导入为SAS数据文件work.sryzc。IDR_IDIncomeOutgoIDR_IDIncomeOutgo1217941550162220020602217161365171273022363134102730181249614554217651530191176010405221841900201282023666220502050212225019667224602184221317024008119

5、76117023212001250912850249624217761350101427527602521980179411220101275261245525501212236181027210801380131330528202821986120014124001976291336923051522250197030215301316对数据集sryzc中的income变量计算简单统计量,用如下MEANS过程即可:procmeansdata=sryzc;varincome;run;SAS运行结果:可以计算的描述性统计量关键字及其含义见下表。关键字所代表的含义关键字

6、所代表的含义n有效数据记录数skewness偏度nmiss缺失数据记录数kurtosis峰度mean均值t分布位置假设检验之t统计量std标准差probt上述t统计量对应的概率值stderr标准误q1第一四分位数var方差q3第三四分位数median中位数qrange四分位数间距mode众数p1第一百分位数cv变异系数p5第五百分位数max最大值p10第十百分位数min最小值p90第九十百分位数sum总计p95第九十五百分位数sumwgt加权值总计p99第九十九百分位数css校正平方和clm置信限uss未校正平方和lclm置信下限range极差uclm置信上限在PR

7、OCMEANS语句中使用统计量关键字列表。输出数据集sryzc中收入(Income)的观测个数、均值、中位数、第一百分位数、第五百分位数、第九十五百分位数、第九十九百分位数、第一四分位数、第三四分位数、最大值、最小值。procmeansdata=sryzcnmeanmedianp1p5p95p99q1q3maxminvar;varIncome;run;运行结果(3)使用CLASS语句或BY语句class分类变量名列;by分类变量名列;两个语句的区别是:●使用BY语句时要求数据集须按BY变量排序,使用CLASS语句无此要求。●使用BY语句时输出按BY变量的每个值分

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。