资源描述:
《第10章判别分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、判别分析判别分析(discriminantanalysis)是对未知类别的样品进行归类的一种方法。虽然也是对样品进行分类,但它与聚类分析还是不同的。聚类分析的研究对象还没有分类,就是要根据抽取的样本进行分类,而判别分析的研究对象已经有了分类,只是根据抽取的样木建立判别公式和判别准则,然后根据这些判别公式和判别准则,判别未知类别的样品所属的类别。判别分析有着非常广泛的应用,比如在考古学上,根据出土物品判别墓葬年代、墓主人身份、性别;在医学上,根据患者的临床症状和化验结果判断患者疾病的类型;在经济学上,根据各项经
2、济发展指标判断一个国家经济发展水平所属的类型;在模式识别领域,用来进行文字识别、语音识别、指纹识别等。本章主要内容包括:距离判别、贝叶斯(Bayes)判别和Fisher判别(又称典型判别)的理论简介,判别分析的MATLAB实现,判别分析具体案例。10.1判别今折简介10.1.1距雳判别1•马氏距离(Mahalanobis距离)设G为P维总体,它的分布的均值向量和协方差矩阵分别为A=_A._“2•■■z=6丨61•■•(T]2b22■■■••••••2P■■•6•••设兀=(坷,无2,・・・,兀卩)‘,y…,儿
3、)为取自总体g的两个样品,假定x>o(z为正定矩阵),定义七y间的平方马氏距离为〃2(兀y)=(x-y)Y~x-y)定义x到总体G的平方马氏距离为d~(x,G)=(x—//)工"(兀—//)2.两总体距离判断设有两个P维总体G和G2,分布的均值向量分别为M、角,协方差矩阵分别为X]>0,》2〉0。从两总体中分别为抽取容量为兀1,〃2的样本,记为可1,兀12,…,%和兀“,畑…也。现有一未知类别的样品,记为如试判断兀的归属,贝lj有以下判别规则xeG],若d2(x,G})4、x,G
5、)>d'gG?)(101)待判,若d2(x,GJ=dx,G2)•式(10.1)中的距离通常为马氏距离。在采用马氏距离的情况下,下面分情况讨论。(1)X,=Z2=Z己知时将距离d2(x,G2)和d1(x,G])相减可得(f(兀G)-护(兀q)=(%—雄)Z-1(兀―/4)—(x—“)£(兀一“)—2[_(丛;仏)]才(M—“2)A=°"彳,a=X(//]—“2)=(°i,°2,ap)'W(%)=(x-//)a=a(x-/z)则判别规则还可表示为fxeG”若W(x)>0G”若W(x)<0小「卄(1°・2
6、)待判,若W(兀)=0称w(x)为两组距离判别的线性判别函数,a为判别系数(2)Z,=Z9=Z未知时令即由样本得出/A",工的估计,从而可得Q和w(x)的估计只需将式(10.2)中的W(x)换为谚⑴,即可得此时的判别规则。(1)乙H爲己知时令J(x)=d2(x,G})-d2(x,G2)则J(x)为二次判别函数,判别规则为XeG],若JO)>07、(兀一Xi),Sf1(x_Xii=l,2J(x)=d(x,GJ-d(x,G2)将式(10.3)屮的J(x)换为J(x),即可得此种情况的判别规则。3.多总体距离判别设有k个P维总体G],G2,…,Gk,分布的均值向量分别为…,心,协方差矩阵分别为苕>0込>0,…爲。从k个总体中分别抽取容量为2,•••,〃£的样木,记为2/i2Xkl9Xk2*9Xknk现有一未知类别的样品,记为x,试判断x的归属,判别规则为xeG门若=min九GJ(山心'18、工2=・・・=乙=》已知时d2(x,GJ=(x—“J'Y"(x一丛)=x^~[x-2///Z_1x+卩:右'丛=xX1x—2(X'ju訂x—A'Ui’Ci=_込比工i“i,2=1,2,…,k6?2(x,Gz)=x^~}x-2(r丿+cj,i=l,2,・・・,k由于每一个距离中都有一个公共的二次项,故可不予考虑,只需考虑其线性部分。令(x)=rjX+Cj,i=l,2,…,£则判别规则改为XGG,,若聊(兀)=maxWj(x)(10.5)称比(兀)为第i个线性判别函数,厶为判别系数,G为常数项。(2)刀[=工2=
9、•••=》《=工未知时]耳_-A=兀,2=1,2,…,比,〃=工耳3=s—工(耳—1)&z=in-k/=i即由样本得出",•,工的估计,从而可得厶、q和比•(%)的估计Zz=SplXi,S;兀i,攻•(兀)=/丿+C,i=,2,…,k八1一‘Cj=—XI12将式(10.5)中的比•⑴换为Wz(x),即可得此种情况的判别规则。(2)乙上2,・・・,幼不全相等并且未知时令__J2(x,Gz)=(x-X