资源描述:
《【精品】实验十一判别分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、实验十一判别分析实验目的:掌握判别分析在SPSS屮的实现方法。实验工具:SPSS分析工貝菜单项。知识准备:一、判别分析的基本原理在已经将研究对象分成若干组的情况下,根据收集到的新的观测样品的数据和判别规则,来判断新样品应该属于哪个组。具休判别过程中,根据分组情况,可以有两组判别和多组判别之分;根据判别规则不同,有距离判别、贝叶斯判别和典型判别等方法。二、判别分析的基本步骤了解总休分组情况。了解总体可以分为几个组,各个组的数值特征。2.选取判别方法。根据所收集的样本的数据类型以及总体分组情况,决定是采用两组判别还是多组判别,
2、判别时是用距离判别、贝叶斯判别和典型判别中的哪一种。3•判别结果检验。用验证样本带入判别规则(函数),检验其是否具有有效性。三、判别分析的几种方法简介1•距离判别。在距离判别中,经常用马哈拉诺比斯提出的“马氏距离”来进行判断。设是从均值为〃,协方差矩阵为口〉o)的总体G中抽取的两个样品("维),则总休G内两点X与Y之间的平方马氏距离定义为:j2(x,y)=(x-r)z_1(x-r)点x到总体G的平方马氏距离为:d2(x,G)=(X_“)£】(X_“),1)两总体距离判别。设有两总体G.和G2的均值分别为耳和“2,协方差矩阵
3、分别为呂和二(£工2〉0),X网是一个新样本,判断其属于哪个总体。定义X网到G.和G2的距离为d"X,GJ和心XS,则按如下判别规则进行判断:(XWG
4、,若d2(X,G」Sd2(X,G2)(XeG2,若〃2(x,G2)"2(x,G
5、)当纭二二时,该判别式可进行如下简化:d"X,GJ—6/2(X,G2)=(X-/z,),Z-,(X-A.)-(X—“2)‘旷(X如=X'Z_1X—2X'》““+“;门//,-(X'工“X—2X'「“2+“2工T“2)=2X'「(“2-")+("-“2)=-2(X-门仙-心)=-2A(X-//)其
6、中“=*(“]+“2)I人=「(“1_“2)令W(X)=A'(X-Z),则判别规则就成为:(xwGi,若w(x)no(XeG2,若W(X)vO显然W(X)是X的线性函数,故称其为线性判别函数,人称为判别系数。当工严爲时,W(X)=d2(X,Gl)-d2(X,G2)=(X一“])X]'(X一“])一(X一“2)工2、(X-“2)判别规则为:[xwG],若W(X)<0lXeG2,若W(X)〉O2)多总体距离判别。设有£个总体GG,…,G「它们的均值分别是“2,…旳,协方差矩阵分别是纭,工2,…,乙,则样本X到各组的平方马氏距
7、离是=,—1,2•…北判别规则为:xg,若〃2(X,G,)=minJ2(X,G)£j£kJ2•贝叶斯判别。设有k个总体G],G2,・・g,且Gq〜Np(如Z),Z>o,a=1,2•…,ko又设样本X来自总体G“的先验概率为%,“1,2・・.十,满足如+%+…+9严1。X到彳的平方马氏距离是:d2(X,Ga)=(X-^)'X;l(X-^a)来自氏的X的梯A■呂度为:乙(X)=(20"平「2exp[_o.5d;(X,Gj]根据贝叶斯定理,X属于G”的后验概率为:a=12P〈G」X〉=严尢以)£q8、XeGx,若P(GiX)=maxP^Gix)3•费希尔判别。用P维向量X=X,X2,…宀)的少数几个线性组合(称为判别式或典型变量)儿=aN力勺2禺…,儿=a;x(一般厂明显小于〃)来代替原始的0个变量勺,兀2,…,,以达到降维的目的,并根据这厂个判别式)d儿,…,儿对样品的归属作出判别。设来自组©的卩维观测值为x”,j=l,2,…,”心1,2,将它们投影到某一共同方向,得到的投影点是线性组合儿二ax加=1,2,…,心=1,2,・・£,其中a表示投影方向。这时的为可以组成一元方差分析数据。其组间平方和表示为kkSSTR
9、=工坷(%—刃2=工坷(axf-ax)2=aBa/=1i=k式中b=Y呃—司区-对,百和衣分别为第i组均值和总均值向/=!/=!J=1式中,E=工£(-和。/=!J=1组内平方和为:sse=YX();;-z)2=EE1如數组均值有显著差异则一籍沽干V应充分地大,或者A(a)=沁应充分地大。所以问题转化为求債,使得A(a)aEa达到最大。当用任意非零常数c乘以a,所得A(ca)仍可达到最大,所以a并不唯一。此,将a约束为aa=l,S厂丄E是当n-kX,=Z2=---Z,=Z时工的无偏估计
10、。由矩阵知识可知M(a)的极大值为血是]B—AE[=O的最大特征值。设0-旳=0的全部非零特征值依次为栓血>--->^>0,对应特征向量为t1?t2,,to当a=t]时,可使A(a)达到最大。由于△(町的大小可衡量判别函数y=ax的效果,故称A(a)为判别效率。在许多情况下,仅用一个判别函数不能很好区别