应用统计学 第四章 判别分析

应用统计学 第四章 判别分析

ID:43213256

大小:1.40 MB

页数:76页

时间:2019-10-03

应用统计学 第四章 判别分析_第1页
应用统计学 第四章 判别分析_第2页
应用统计学 第四章 判别分析_第3页
应用统计学 第四章 判别分析_第4页
应用统计学 第四章 判别分析_第5页
资源描述:

《应用统计学 第四章 判别分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第四章判别分析discriminantanalysis判别分析的基本概念两总体判别分析多总体判别分析SPSS的判别分析过程一、判别分析的基本概念判别分析问题的描述:已知若干组分类数据现有一新样本,要求判定新样本数据属于已知分类中的哪一类判别分析的关键:判别函数:由描述各类的数值指标构成的分类规则,明确已知各类应如何区别例:肝炎病人的诊断两总体判别:肝炎病人和正常人判别依据:一些化验指标,形成判别公式-判别函数Simple,Two-GroupDAMeanofgroup1–fromdatayouhaveMeanofgroup2–fromdatayouhaveUnknownobservatio

2、nx如何判别:x与哪类距离近,就归属于哪类:若dx1dx2,则x属于第2类判别函数:f=dx1-dx2>0,x∈2,<0,x∈1判别规则中国属于发展中国家还是发达国家?PatternRecognitionProblem判别分析与方差分析、聚类分析聚类分析与判别分析间的联系先采用聚类分析获得各个个体的类别(classification);然后采用判别分析建立判别函数,对新个体进行类型识别(identification)聚类分析的数据格式k判别分析的数据格式判别分析的方法与数学描述数据描述对于m类总体G1,G2,……,Gm,其分布函数分别为f1(y),f2(

3、y),……fm(y),对于一个给定样品y,我们要判断出这个样本来自哪个总体。判别分析的主要问题就是如何寻找最佳的判别函数和建立判别规则。误判问题肝功指标高就一定是肝炎病人吗?误判率Misclassification(1-Dcase)两总体单指标的判别分析,假设正态分布,等方差判别规则转氨酶肝炎患者非患者非典??Best-InWhatSense?MinimizesprobabilityofmisclassificationMaximizesposteriorprobabilityofcorrectclassificationManyothersForexampleminimizesthec

4、ostofmisclassification具体问题具体分析疾病的诊断市场分析Lotsofperspectivessuggestthisbasicruleasbest影响误判率的因素当分布中心过于接近,误判率很高三总体单指标——组均值差异Threegroups-Twofeatures二、两总体判别分析基本思想:样品和哪个总体距离最近,就判断它属于那个总体。设:两个总体G1和G2,x是一个p维样本,x到总体G1和G2的马氏距离分别记为d2(x,G1)和d2(x,G2),判别规则:若d2(x,G1)d2(x,G2),认为x属于G2

5、。或判别函数:W(x)=d2(x,G2)-d2(x,G1)>0,x∈G1<0,x∈G2所谓“等距离”:到两总体距离相等的点构成类分界线1.马氏等距离法两指标、正态分布且方差相等的两总体类分界线样本点到某一类的距离越近,属于该类的概率越大线性判别函数设G1~N(1,∑1)和G2~N(2,∑2)为两正态总体,且协差阵相等,即∑1=∑2=∑,则样本x到G1、G2的马氏距离为可以证明:容易看出上述函数W(x)为x的线性函数,称为线性判别函数,判别准则:W(x)与0比较x∈G1,当W(x)>0,x∈G2当W(x)<0,令W(x)=0可以得到两类分界线LinearDiscriminationRu

6、leW(x1,x2)=0W(x1,x2)>001G1G2考察p=1的情况设G1~N(1,2)和G2~N(2,2),判别函数为:x=0.5误判率P(2/1)=0.3085误判率P(1/2)=?∑1≠∑2时,非线性判别函数判别函数W(x)为x的二次函数直观判断x0属于哪一类?G1:N(80,0.25)G2:N(75,4)7580x0=78已知G1是设备A生产的产品,G2是设备B生产的产品。A设备质量高,其产品平均耐磨度1=80,方差12=0.25,B设备质量较差,其产品平均耐磨度2=75,方差22=4。现有一产品X0,其耐磨度x0=78,试判断该产品是哪台设备生产的。考察p=

7、1的情况直观上看,x0距1较近,但是考虑到相对分散度,判别准则x1x22.Fisher判别法基本思想:寻找原变量x的一个线性组合,使得各组在此方向上投影的差异最大化,再选择合适的判别规则对样品进行分类判别。Fisher’sapproachFindalinearcombinationofvariablesxthatwouldproduce“maximallydifferent”discriminantscoresacrossgrou

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。