第一章数据描述性分析

第一章数据描述性分析

ID:16066359

大小:1.21 MB

页数:32页

时间:2018-08-07

第一章数据描述性分析_第1页
第一章数据描述性分析_第2页
第一章数据描述性分析_第3页
第一章数据描述性分析_第4页
第一章数据描述性分析_第5页
资源描述:

《第一章数据描述性分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第一章数据描述性分析教学目标:本章是数据分析的描述性分析,需要掌握数据的一些基本数字特征、相关分析,以及数据的分布检验,并能够熟练地运用SAS软件计算数字特征、相关分析、作出数据的分布图及进行分布检验。重难点:运用SAS软件计算数字特征、相关分析、作出数据的分布图及进行分布检验。第零节SAS系统简介(约2课时)SAS(StatisticalAnalysisSystem缩写)软件是应用最为广泛的数据分析软件之一,包含了从简单的描述性分析到复杂的多元统计、生存分析等广泛的数据分析方法。为便于区分,我们约定对SAS系统的专用语句及编程语句用大写字母,对一些说明星的语句用小写字母,而在具体上机

2、编程中不必如此。SAS系统是在Windows环境下的一个数据分析软件,其界面包括三部分:程序窗口、SASlog窗口及输出结果窗口。一.数据的输入与输出*数据集的建立SAS系统是按每个观测向量逐个处理数据,一个典型的SAS数据集由变量行和数据行组成:变量行数据行建立SAS数据集的常用方法有两种,一是在程序窗口直接输入数据,二是利用已有数据集建立SAS数据集。1.直接输入数据建立SAS数据集在程序窗口直接输入数据,其基本语句形式为DATAname;INPUTvariables;CARDS;datalines;说明:1)要建立永久性数据集,要采用二级命名。若不赋予数据集名称,则自动赋予名称D

3、ATA1、DATA2、…。2)非数据变量,需要在变量名后空一格,再写“$”。输入变量的格式有两种:自由和固定。①自由格式输入。在“INPUT”后依次输入各变量,变量之间用空格分开;32②格式化输入3)如果数据的每一行有多于二组观测向量,则在变量后加“@@”。4)“;”表示数据结束。2.利用外部数据集建立SAS数据集DATAname(新数据集名);INFILE‘drivelocation:filename’(外部数据集的路径及数据集名称);INPUTvariables(根据外部数据集的格式确定相应得变量输入格式);*SAS数据集的输出格式:PROCPRINTDATA=name;说明:打印

4、观测向量序号OBS、各变量名及其取值。二.利用已有的SAS数据集建立新的SAS数据集*两个SAS数据集的合并1)串联语句形式:DATAname(新数据集名);SETAB;说明:两数据集必须有相同的变量。2)并联语句形式:DATAname(新数据集名);MERGEAB;说明:两数据集必须有相同数据行。*变量值得排序语句形式:DATAnewname;PROCSORTDATA=name;BY(DESCENDING降序,否则就是升序排列)variable;*删除数据集中的某些数据行语句形式:DATAnewname;SETDATA=name;IFconditionsTHENDELETE;说明:“

5、conditions”数据行的序号或某个变量的取值所满足的条件。*删除数据集中某些变量及其观测值语句形式:DATAnewname;SETDATA=name;DROPvariables(要删除的变量名)(或KEEPvariables需要保留的变量名)*产生新变量及其观测值语句形式:DATAnewname;SETDATA=oldname;变量的变换公式;32RUN;三.SAS系统的数学运算符号及常用的SAS函数*数学运算符号幂运算“**”,加法“+”,减法“-”,乘法“*”,除法“/”。表达式:变量名=数学表达式或‘非数值字符串’*SAS函数见表9.2。在均匀分布和正态分布等的随机函数中,

6、需要给定初值“Seed”,否则在不同的时刻产生不同的随机数。简单统计量函数种,“arguments”表示一系列数据或已经赋值的一系列变量,将数据或变量逐个列出,并用“,”分开;或者在变量前面加“OF”而不要逗号。四.逻辑语句与循环语句*逻辑语句语句形式:IFconditionsTHENcommand;ELSEcommand;*循环语句SAS循环语句以“DO”开始,“END”结束,有三种形式:1)DOvariable=aTObBYincrement;2)DOUNTIL(condition);3)DOWHILE(condition)作业:实验一第一节一维数据的数字特征(约2课时)一.均值、

7、方差等数字特征一元数据的数字特征主要有下列几种。设样本容量为n的观测值为。1.均值均值即是的平均数:,它表示数据的集中位置。2.方差、标准差与变异系数方差是描述数据取值分散性的一个度量,它是数据相对于均值的偏差平方的平均:方差的开方称为标准差。方差的量纲与数据的量纲不一致,它是数据量纲的平方,而标准差的量纲与数据量纲一致。标准差为32刻画数据相对分散性的度量是变异系数:校正平方和。未校平方和。3.偏度与峰度偏度与峰度是刻度数据的偏态、尾重程度的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。