《多元统计分析》实验上机指导书

《多元统计分析》实验上机指导书

ID:45747797

大小:445.74 KB

页数:67页

时间:2019-11-17

《多元统计分析》实验上机指导书_第1页
《多元统计分析》实验上机指导书_第2页
《多元统计分析》实验上机指导书_第3页
《多元统计分析》实验上机指导书_第4页
《多元统计分析》实验上机指导书_第5页
资源描述:

《《多元统计分析》实验上机指导书》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、第一章聚类分析一、实验目的与要求1.通过上机操作使学生掌握系统聚类分析方法在SAS和SPSS软件中的实现,熟悉系统聚类的用途和操作方法,了解各种距离,能按要求将样本进行分类;2.要求学生重点掌握该方法的用途,能正确解释软件处理的结果,尤其是冰柱图和树形图结杲的解释;3.要求学生阅读一定数量的文献资料,掌握系统聚类分析方法在写作中的应用。二、实验内容与步骤SAS部分(-)SAS程序语言简介SAS系统强大的数据管理能力、计算能力、分析能力依赖于作为其基础的SAS语言。SAS语言是一个专用的数据管理与分析语言,它的数据管理功能类似于数据库语言(如FoxPro),但乂添加了一般高级程序设计语言的许

2、多成分(如分支、循环、数组),以及专用于数据管理、统计计算的函数。SAS系统的数据管理、报表、图形、统计分析等功能都可以用SAS语言程序來调用,只要指定耍完成的任务就可以由SAS系统按照预先设计好的程序去进行,所以SAS语言和FoxPro等一样是一种第四代计算机语言。SAS语言有它自己的对变量、常量、表达式的一系列规定,有一系列标准函数,有它自己的语句、语法,可以按一定规则构成SAS程序。SAS语言程序由数据步(DATA步)和过程步(PROC步)组成。数据步用來生成数据集、计算、整理数据,过程步用來对数据进行分析、报告。SAS语言的基本单位是语句,每个SAS语句一般由一个关键字(如DATA

3、,PROC,INPUT,CARDS,BY)开头,包含SAS名字、特殊字符、运算符等,以分号结束。SAS关键字是用于SAS语句开头的特殊单词。SAS名字在SAS程序中标识各种SAS成分,如变量、数据集、数据库,等等。SAS名字由1到8个字母、数字、下划线组成,第一个字符必须是字母或卜•划线。SAS关键字和SAS名字都不区分大小写。语句关键字用大写或小写方式都可以,但不可简化,必须原样照写。SAS程序由语句构成。一个SAS语句可以占若干行,可以从任意一列开始,但必须在语句结束处加分号,因为SAS系统是根据分号判断哪些文字属于一个语句的,因此在一行上可以写几个SAS语句,只要每个语句都用分号结束

4、(最常见的SAS编程错误就是丢失分号)。因为分号作为语句结束标志,所以SAS语句不需要单独占一行,一个语句可以写到多行(不需任何续行标志),也可以在一行连续写儿个语句。SAS语言中只要允许用一个空格的地方就可以加入任意多个空白(空格、制表符、冋车),允许用空格的地方是名字周围、运算符周围。比如,程序procprintdata=c9501;byavg;run;和procprintdata=c9501;byavg;run;是等效的。另外,虽然SAS关键字和SAS名字不区分大小写,但字符型数据值要区分大小写,比如"Beijing〃和〃BEIJIKG〃被认为是不同的数据值。在SAS程序中可以加入注

5、释,注释使用C语言语法,用/*和*/在两端界定注释,这种注释可以出现在任何允许加入空格的位置,可以占多行。我们一般只把注释单独占一行或若干行,不把注释与程序代码放在同一行。注释的另一个作用是把某些代码暂时屏蔽使其不能运行。下面是一个注释的例子:/*生成95级1班考试成绩的数据集*/datac9501;SAS程序包括数据步和过程步两种结构,每一个步是一段相对完整的可以单独运行的程序。每个步以RUN语句结束。当一个步后面跟着另一个步时,前面一个步的RUN语句可以省略。一个DATA步后面可以跟儿个PROC步,也可以若干个DATA步后面跟几个PROC步;或以PROC步打头,后面跟若干个DATA步,

6、再跟PROC步,程序中的每个步都是相应独立的,彼此不能交叉,不能嵌套。数据步用来生成、整理数据和白编程计算,过程步调用SAS已编好的处理过程对数据进行处理。我们自己用SAS编程序实现各多元统计分析方法主要用到过程步。在本课的学习过程中,主要采用调用己有数据集的方式,因此程序的重点在PROC步上,要分析的数据集只要在选择项DATA二小指明即可。最简单的PROC步只有一个PROC语句,UP:PROC过程名;该语句调用指定的过程分析在该语句之前最近建立的数据集。在调用时的其他要求全部采用SAS系统设置的缺省值。PROC语句的一般格式为:PROC过程名选择项;(二)用CLUSTER过程和TREE过

7、程进行谱系聚类聚类分析又称群分析、点群分析,是定量研究分类问题的一种多元统计方法。聚类分析的基本思想是认为所研究的样品或指标Z间存在着程度不同的相似性,于是根据一批样品的多个观测指标,找出能够度量样品或变量之间相似程度的统计量,并以此为依据,采用某种聚类法,将所有的样品或变量分别聚合到不同的类中,使同一类中的个体冇较大的相似性,不同类中的个体差异较大。所以,聚类分析依赖于对观测间的接近程度(距离)或相似程度的理解,定义不

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。