统计实验(判别分析).doc

统计实验(判别分析).doc

ID:56237579

大小:153.00 KB

页数:6页

时间:2020-03-23

统计实验(判别分析).doc_第1页
统计实验(判别分析).doc_第2页
统计实验(判别分析).doc_第3页
统计实验(判别分析).doc_第4页
统计实验(判别分析).doc_第5页
资源描述:

《统计实验(判别分析).doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、实验二判别分析1.实验目的:木实验讨论利用判别分析将待判样品进行归类的问题。通过该实验,能够起到如下的效果:⑴理解判别分析的作用、思想、数学基础、方法和步骤;(2)熟悉如何利用判别分析,提出问题、分析问题、解决问题、得出结论;(3)会调用SAS软件实现判别分析的各个步骤,根据计算的结果进行分析,得岀正确的结论,解决实际的问题。2.知识准备:判别分析是要把待判样品按与已知类别的相近程度进行归类。其思想是:先给出与已知类别相近稈度的量化标准,然后按照该标准,计算待判样品与已知类别的相近程度,将待判样品归入最接近的类别。相近稈度的量化标准有很多种,如:距离判

2、别法、费歇尔判别法、贝叶斯判别法、逐步判别法等,它们的数学表述备不相同。判别分析步骤大体分为(以贝叶斯判别法为例):首先由已知类别的数据(也称为训练样木的数据)根据贝叶斯公式计算出后验概率;然示结合损失函数得到判别函数,以判别函数的取值作为与匕知类别相近稈度的星化标准(函数值越人表示越相近);接着把训练样木的数据反代冋判别函数,计算出其函数值,重新判断它们的类别(称冋判类别),得到与原始类别不同的比例(谋判率),以判断该方法是否有效(冋判的方法还可采用交叉冋判法,其思想是冋判某个训练样品时,暂时将它作为待判样品,把它从训练样品屮去掉,重新计算判别函数,

3、然示判断该样品的类别);最麻把待判样品的数据代入判别函数,算出函数值,将待判样品归入最相近的类别。3.实验内容:人文发展指数是联合国开发计划署于1990年5月发表的第一份《人类发展报告》屮公布的。该报告建议,目前对人文发展的衡量应当以人生的三大要素为重点,衡量人生三大要素的指标采用XI-岀生时的预期寿命(岁)、X2-成人识字率(百分比)、X3-实际人均GDP,将以上三个指标的数字合成一个复合指数,即为人文发展指数。今从1995年世界各国人文发展指数的排序中,选取高发展水平、•I「等发展水平的国家各五个作为样品,另选4个国家作为待判样品(数据见表1,选自

4、《世界经济统计研究》1996年第一期)。利用贝叶斯判别法进行判别分析,判断4个待判样品分别属于哪一类?【1】实验步骤;序国家XIX2X3类1美国7699537412II木79.599535913瑞士7899537214阿根廷72.195.9524215阿联酋73.877.7537016保加利亚71.293425027古巴75.394.9341228巴拉圭7091.2339029格鲁吉亚72.8992300210南非62.980.6379921中国6&579.319502罗马尼亚69.996.928403希腊77.693.852334哥伦比亚69.390

5、.35158表1人生三大要素指标数据SAS酚:Datahumanl;inputnoXIX2X3type;labelXI二'A'X2二'B‘cards;1769953741279.599535913789953721472.195.952421573.877.753701671.29342502775.394.93412287091.233902972.8992300210•62.980.637992run;Datahuman2;inputnoXIX2X3;labelXl=A'X2二'B'X3二'C';cards;168.579.31950269.996

6、.92840377.693.85233469.390.35158Procdiscrimdata^humanltestdata^human2cross!isterrtestlist;classtype;varX1-X3;run;语句解释:"Datahuman1;指将数据输入到文件"human1w中;"inputnoXIX2X3type;"指将后面数据对应地赋予变量“XIX2X3type”,其中“no”指序号;ulabelXI二'A'X2二'B'X3二'C';”指记变量“XIX2X3”的标签为“ABC”;uDatahuman2;w指将后面的数据输入到文件“

7、human2”中;"Procdiscrim”指调用判别分析的程序;“dataFhuman1testdata=human2”指训练样本的数据在文件"humanl”中,待判样木的数据在文件“human2,,;"crosslisterr”指利用交义判别的方法进行冋判,并输出冋判结果;“testlist”是输出样品归类的结果;“classtype”指变量“type”是分类的类别;“varX1-X3”指用來作判断的变量是“X1-X3”,其它更多的语句参见书【2】。运行结果及解释:图1中的数据"Observations”指样品个数;"Variables”扌旨变量个

8、数「'Classes”指类别的个数;"DFTotal"指总自由度;"DFWithinClass

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。