资源描述:
《第八章 判别分析ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、判别分析DiscriminantAnalysis判别分析的相关例子(1)在经济中的应用:中小企业的破产模型为了研究中小企业的破产模型,选定4个经济指标:X1总负债率(现金收益/总负债)X2收益性指标(纯收入/总财产)X3短期支付能力(流动资产/流动负债)X4生产效率性指标(流动资产/纯销售额)对17个破产企业(1类)和21个正常运行企业(2类)进行了调查,得关于上述四个指标的资料现有8个未知类型的企业的四个经济指标的数据,判断其属于破产企业一类还是正常运行企业一类?判别分析的相关例子(2)在天气预报中的应用根据经验,下列两个因素是预报明天下雨与不下雨的重要因素:今天与昨天的湿度差x1今
2、天的压温差(气压与温度之差)x2今测得x1与x2,应预报明天下雨还是预报明天不下雨?判别分析的其他例子预测新产品的成功或失败判断一个人是否患有某种疾病按职业兴趣对学生分组确定某人信用风险的种类……前言判别分析是一种进行统计判别和分组的技术手段。判别分析与聚类分析的不同之处在于判别分析带有“预测”意义。判别分析的目的就是从现有已知类别的样本数据中训练出一个判别函数,以后再有未知类别的数据进入,就利用建立的函数来判断其类别(判别规则)。各类判别问题的前提有所不同,进行划分或寻找判别函数的准则也可以不同,判别分析的方法有:距离判别,费歇判别,贝叶斯判别等。判别分析与聚类分析的联系与区别都要求对样
3、本进行分类,但分析的内容和要求不一样聚类分析事先并不知道存在什么类别,完全按照反映对象特征的数据把对象进行分类判别分析是在事先有了某种分类标准之后,判定一个新的研究对象应该归属到哪一类别某些思想和方法相同两者往往结合起来使用当分类不清楚时,可以先用聚类分析对原有样品进行分类,然后再用判别分析建立判别函数以对新样品进行归类例8.1根据经验,今天与昨天的湿度差x1及今天的压温差(气压与温度之差)x2是预报明天下雨或不下雨的两个重要因素。今测得x1=8.1,x2=2.0,试问应预报明天下雨还是预报明天不下雨?例8.1X120100-10-20X220100-10-20新样本点U(x1,x2)D2
4、---非雨区D1---雨区这是一个最简单的判别分析问题由判别因子x1和x2:将二维样本空间划分成两个互不相交的区域D1和D2,根据新样品判别因子的观察值,若它落在区域Di,就判该样品属于i类构造一个判别函数u(x1,x2),然后根据新样品的函数值判断其属于哪一类数学模型(概率论的角度)模型:G个总体:ξ1,ξ2,…,ξg,…,ξG其中ξg是p维随机变量对应的分布函数Fg(x1,x2,…,xp)g=1,2,…,G(x1,x2,…,xp)是表征总体特性的p维随机变量的取值,在判别分析中称之为判别因子。现有一个新的样本点x=(x1,x2,…,xp)’要判断此样本点是属于哪一个总体的?假如能掌握每
5、一个总体ξg的分布规律或某些数字特征,则这类问题的解决是不难的实际处理方法在每一个总体中取一个容量为ng的样本(g=1,2,…,G),然后根据已知类别的样本所提供的信息,判断新的样本点属于哪一类一般判别分析的模型需要判别的类型有G类,起判别作用的因子有p个:(x1,x2,…,xp),从第g类中取得ng个样品,其第i个样品的p个判别因子的取值为:xi(g)=(xi1(g),xi2(g),…,xip(g))′对p维空间作出一个划分:D1,D2,…,DG互不相交或者构造一个判别函数:u(x1,x2,…,xp)以u(x1,x2,…,xp)作为新样品所属类型的判断常用的判别方法距离判别Fisher判
6、别Bayes判别逐步判别距离判别距离判别判别准则根据各类的ng个样本,求出每类的中心坐标再根据新样品离开每个类中心的距离远近作出它属于哪一类的判断(1)两类距离判别:设有两个总体:ξ1,ξ2d(x,ξg)的计算选用马氏距离d2(x,ξg)=(x-μg)’∑-1(x-μg)此距离表示x与随机向量ξg(x到总体ξg的距离)的距离,即x到ξg的均值μg的马氏距离。判别规则判别函数:为线性判别函数,其中a称为判别系数利用判别函数进行判别判别规则为:若u(x)>0,则判x∈ξ1若u(x)<0,则判x∈ξ2利用u(x)将样本空间RP进行划分划分当μ1、μ2、∑未知(2)两类距离判别:μ1μ2μ*p>1
7、时可按多类判别中G=2时的特殊情况处理注意要点(1)μ1μ2μ2只有当两个总体的均值有显著差异时判别分析才有意义注意要点(2)为减少误判的可能性,有时可划定一个待判区域bc多类距离判别:设有多个总体:ξ1,ξ2,…,ξG判别规则:若d(x,ξg)=mind(x,ξi)则判x∈ξg选用马氏距离d2(x,ξg)=(x-μg)’∑-1(x-μg)当μg、∑g(g=1,2,…,G)未知多类距离判别:∑1=∑2=…=∑G距离判别的