统计实验(判别分析)

统计实验(判别分析)

ID:44436943

大小:235.63 KB

页数:6页

时间:2019-10-22

统计实验(判别分析)_第1页
统计实验(判别分析)_第2页
统计实验(判别分析)_第3页
统计实验(判别分析)_第4页
统计实验(判别分析)_第5页
资源描述:

《统计实验(判别分析)》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、实验二判别分析1.实验目的:本实验讨论利用判别分析将待判样品进行归类的问题。通过该实验,能够起到如下的效果:(1)理解判别分析的作用、思想、数学基础、方法和步骤;(2)熟悉如何利用判别分析,提出问题、分析问题、解决问题、得出结论;(3)会调用SAS软件实现判别分析的各个步骤,根据计算的结杲进行分析,得出正确的结论,解决实际的问题。2.知识准备:判别分析是耍把待判样品按与已知类别的相近程度进行归类。其思想是:先给旳竺知类别相近竺的乎化标准,然斤按照该标准,计算待判样品与已知类别的相近程度,将待判样品归入最接近的类别「和近程度的彊化标准有很多种,如:距离

2、判别法、费歇尔判别法、贝叶斯判別法、逐步判别法等,它们的数学表述各不相同。判别分析步骤人体分为(以贝叶斯判别法为例):首先由已知类別的数据(也称为训练样木的数据)根据贝叶斯公式计算岀后验概率;然后结合损失函数得到判别函数,以判别函数的取值作为与己知类别相近程度的量化标准(函数值越大表示越相近);接着把训练样木的数据反代冋判别函数,计算出其函数值,重新判断它们的类别(称回判类别),得IJ与原始类别不同的比例(误判率),以判断该方法是否有效(冋判的方法还可采川交叉冋判法,其思想是冋判某个训练样品时,暂时将它作为待判样品,把它从训练样品中去掉,重新计算判别

3、函数,然后判断该样品的类别);最后把待判样品的数据代入判别函数,算出函数值,将待判样品归入最相近的类别。3.实验内容:表1人生三大要素指标数据人文发展指数是联合国开发计划署于1990年5序国家XIX2X3类月发表的第一份《人类发展报告》中公布的。该1美国769953741报告建议,H前对人文发展的衡量应当以人牛的2日本79.59953591三大要素为重点,衡量人生三人要素的指标采川3瑞士789953721XI-岀生时的预期寿命(岁)、X2-成人识字率(百4阿根廷72.195.952421分比)、X3-实际人均GDP,将以上三个指标的数5阿联酋73.8

4、77.753701字合成一个复合指数,即为人文发展指数。6保加利亚71.29342502今从1995年世界各国人文发展指数的排序中,7古巴75.394.934122选取高发展水平、屮等发展水平的国家各五个作8巴拉圭7091.233902为样品,另选彳个国家作为待判样品(数据见表9格鲁吉亚72.899230021,选自《世界经济统计研究》1996年第一期)。10南非62.980.637992利用贝叶斯判别法进行判别分析,判断4个待判1中国6&579.31950样品分别属于哪一类?[1]2罗马尼亚69.996.928403希腊77.693.852334.

5、实验步骤:1哥伦比亚69.390.35158SAS程序:Datahuman1;inputnoXIX2X3type;labelXI二'A'X2=‘cards;1769953741279.599535913789953721472.195.952421573.877.753701671.29342502775.394.93412287091.233902972.8992300210•62.980.6379929run;Datahuman2;inputnoXIX2X3;labelX1='A'X2二'B'X3二'C;cards;168.579.3195026

6、9.996.92840377.693.85233469.390.35158run;Procdiscrimdata=humanltestchta二humsn2crosslisterrtestlist;classtype;varX1-X3;run;语句解释:"Datahuman1;w指将数据输入到文件"humanl”中;"inputnoXIX2X3type;”指将后面数据对应地赋予变量“XIX2X3type”,其中“no”指序号;“labelXI二'A'X2二'B'X3二'C';”指记变量“XIX2X3”的标签为“ABC”;“Datahuman2;w指将

7、后面的数据输入到文件"human2n中;“Procdiscrim”指调用判别分析的程序;"data二human1testdata=human2"指训练样本的数据在文件uhuman1中,待判样本的数据在文件“human2”;"crosslisterr”指利用交叉判别的方法进行回判,并输出回判结果;“testlist”是输岀样品归类的结果;“classtype”指变量“type”是分类的类別;“varX1-X3”指川来作判断的变量是“X1-X3”,其它更多的语句参见书【2】。运行结果及解释:图1中的数据“Observations"指样品个数「'Varia

8、bles”指变量个数;“Classes”指类别TheDISCRIMProcedureObservations

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。