欢迎来到天天文库
浏览记录
ID:19898199
大小:449.50 KB
页数:40页
时间:2018-10-07
《第7章 判别分析》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第7章判别分析(DiscriminateAnalysis)zf判别分析一、判别分析的应用领域二、费歇尔判别的思想三、SPSS的判别分析判别函数的建立判别函数验证判别函数的图形表示主要内容zf27.1判别分析的基本思想一、什么是判别分析?判别分析根据已知对象的某些观测指标和所属类别来判断未知对象所属类别的一种统计学方法。如何判断(判断依据)?利用已知类别的样本信息求判别函数,根据判别函数对未知样本所属类别进行判别判别分析的特点(基本思想)1、是根据已掌握的、历史上若干样本的p个指标数据及所属类别的信息,总结出该
2、事物分类的规律性,建立判别公式和判别准则。2、根据总结出来的判别公式和判别准则,判别未知类别的样本点所属的类别。判别分析的目的:识别一个个体所属类别zf3判别分析的应用:无处不在医学:例1:在医学诊断中,一个病人肺部有阴影,医生要判断他患的是肺结核、肺部良性肿瘤还是肺癌?肺结核病人、肺部良性肿瘤病人、肺癌病人组成三个总体,病人来自其中一个总体,可通过病人的指标(阴影大小、边缘是否光滑等)用判别分析判断他来自哪个总体(即判断他患的什么病?)zf4经济学:例2:中小企业的破产模型为了研究中小企业的破产模型,选定4
3、个经济指标:X1总负债率(现金收益/总负债)X2收益性指标(纯收入/总财产)X3短期支付能力(流动资产/流动负债)X4生产效率性指标(流动资产/纯销售额)对17个破产企业(1类)和21个正常运行企业(2类)进行了调查,得相关资料,并构建判别函数。zf5.07-.011.37.34待判-.13-.141.42.44待判.15.062.23.56待判.16.052.31.20待判.29.061.84.38待判.54.112.33.48待判zf6企业序号判别类型判别函数得分判别为1的概率判别的为2概率1231-.5
4、9642.70620.2938041-1.02182.83420.1658052.25719.35312.6468862.34253.32005.679952.27925.34442.6555821.24010.09012.90988zf7例3:根据信息基础设施的发展状况,对世界20个国家和地区进行分类。考察指标有6个:1、X1:每千居民拥有固定电话数目2、X2:每千人拥有移动电话数目3、X3:高峰时期每三分钟国际电话的成本4、X4:每千人拥有电脑的数目5、X5:每千人中电脑使用率6、X6:每千人中开通互联网
5、的人数zf8分析结果:将20个国家分为两类第1类(基础设施落后):巴西、墨西哥、波兰、匈牙利、智利、俄罗斯、泰国、印度、马来西亚第2类(基础设施发达):瑞典、丹麦、美国、中国台湾、韩国、日本、德国、法国、新加坡、英国、瑞士如果:我们想知道我国基础设施发展属于哪一类型?运用判别分析依据:20个国家的分类信息构建判别函数zf9二、判别分析的基本要求:1、分组类型在两组以上;2、每组样本(或案例)个数至少一个以上;3、解释变量必须是可测量的三、判别分析与聚类分析的比较:1、判别分析是在已知研究对象分成若干类型并已取
6、得各种类型的一批已知样本的观测数据,在此基础上根据某些准则建立判别式,然后对未知类型的样本进行判别分类。2、聚类分析则是对研究对象的类型未知的情况下,对其进行分类的方法。zf103、判别分析和聚类分析往往联合使用。当总体分类不清楚时,先用聚类分析对一批样本进行分类,再用判别分析构建判别式对新样本进行判别。此外判别分析变量情况:被解释变量为属性(定类)变量;解释变量是定量变量。zf11四、判别分析类型及方法(1)按判别的组数来分,有两组判别分析和多组判别分析(2)按区分不同总体所用的数学模型来分,有线性判别和非
7、线性判别(3)按判别对所处理的变量方法不同有逐步判别、序贯判别。(4)按判别准则来分,有费歇尔判别准则、贝叶斯判别准则。SPSS的判别分析的输出结果以费歇尔判别为主。zf127.2距离判别基本思想:即:首先根据已知分类的数据,分别计算各类的重心即各组(类)的均值,判别的准则是对任给样品,计算它到各类重心的距离,哪个距离最小就将它判归哪个类。zf13zf147.3费歇尔(Fisher)判别所谓Fisher判别法,就是用投影的方法将k个不同总体在p维空间上的点尽可能分散,同一总体内的各样本点尽可能的集中。用方差分
8、析的思想则可构建一个较好区分各个总体的线性判别法。zf15两类Fisher判别示意图X2X1G1G2zf16两类Fisher判别示意图X2X1G1G2y=c1X1+c2X2zf17(一)基本思想设有A、B两个总体,分别有个历史样本数据,每个样本有P个观测指标,每个样本可看作P维空间中的一点。Fisher借助于方差分析的思想构造一个线性判别函数:其中,判别系数的选择应使得y值满足:(1)A类和B类的样
此文档下载收益归作者所有