逐步判别分析

逐步判别分析

ID:44679817

大小:177.01 KB

页数:8页

时间:2019-10-24

逐步判别分析_第1页
逐步判别分析_第2页
逐步判别分析_第3页
逐步判别分析_第4页
逐步判别分析_第5页
资源描述:

《逐步判别分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、逐步判别分析一、逐步判别分析的基本思想在判別问题中,当判别变量个数较多时,如果不加选择地一概采用来建立判別函数,不仅计算量大,还市于变量Z间的相关性,可能使求解逆矩阵的计算精度下降,建立的判别函数不稳定。因此适当地筛选变最的问题就成为一个很重要的事情。凡具有筛选变最能力的判别分析方法就统称为逐步判别法。逐步判别法和通常的判别分析一样,也有许多不同的原则,从而产生各种方法。这里讨论的逐步判別分析方法是在多组判别分析阜础上发展起来的一种方法,判别准则为贝叶斯判别函数,其基木思路类似于逐步回归分析,采川“冇进冇出”

2、的算法,即按照变量是否重要,从而逐步引入变量,每引入一个“最重要”的变量进入判别式,同时要考虑较早引入的变量是否由于其后的新变量的引入使Z丧失了重要性变得不再显著了(例如其作用被后引入地某儿个变量的组合所代替),应及吋从判别式中把它剔除,总到判别式中没有不重要的变量需要剔除,剩卜•来的变量也没有重要的变量可引入判别式时,逐步筛选结束。也就是说每步引入或剔除变量,都作相应的统计检验,使最后的贝叶斯判别函数仅保留“重要”的变量。二、逐步判别的基础理论一一对判别变量附加信息的检验根据逐步判别分析的基本思想,进行判别

3、分析需要解决两个关键的问题,一个是引入或剔除判别变量的依据和检验问题;另外则是判别函数的及吋导出的问题。其中的理论基础乂在于如何对判别变量在区别各个总体中是否提供附加信息的检验。为此这里先给出如何对判别变量在区别各个总体中是否捉供附加信息进行检验的棊础理论。设冇加个总体,GpG2••G/Zl,相应抽出样品个数为州,•••nm(“I+巾2+…心)=几每个样品观测P个指标得观测数据如下,心(1)第1个总体的样本数据为:勺°)•••坷2(1)…®(1)ZD…呵(1)■•••••••■%(1)%(1)…g(1)兀ii

4、(2)州2⑵…xlp(2)第2个总体的样本数据为:兀21⑵无22⑵…也⑵……:・•・%1(2)©22⑵…怙⑵兀11(加)兀12(加)…x1/?(m)第加个总体的样木数据为.心伽)兀22(加)…怙(〃?)……;...切(加)%(加)…“(加)和多组判别分析-样,假定各组的样品都是相互独立的止态随机向量,各组的协方差矩阵都一样,即(X;f,X:?,…=N(“a,E)a=12…m;k=1,2,•••;?其中,x:『为a组第k个样甜的第丿个变量,血为a组的均值向量,工为协方差矩阵。再令全部样品的总均值向量为:戸=(耳

5、,元2,…召)各个总体的样品的均值向量为:乂C)=(元I(Q),壬2(a),…兮(a))a=1,2,•••m于是,样品的组内离差阵为:W%W=工工a(Q)-乂(Q))a(a)-X(a))0=1f=l样品的总离差阵为:卩二H(E(a)-x)a@)-乂)a=l/=

6、为了对这加个总体建立判别函数,需要检验:H():“⑴=如=…二如)当H。被接受时,说明区分这加个总体是没创•么意义的,在此基础上建立的判别函数效果不好。当H()被否定时,说明加个总体可以区分,建立的判别函数有意义。但是为了达到区分这加个总体的FI的,原

7、来选择的〃个指标是否可以减少而达到同样的判别效果,为此,也就要去掉一些对区分加个总体不带附加信息的变量。对于上述问题的检验,可以采用维尔克斯统计fi(Wilks)A来进行:而一n一―(/?-Z7?)-lInA的极限分布是服从于大样本的%p(加—1)]。2丿为了进一步考虑这一问题,把0个变量分解为两个部分,如果通过某种步骤已经选中了p-1个变量,我们要检验增加第P个变量后对区分总体是否捉供了附加信息,即对笫P个变量的“判别能力”进行检验。为此,将矩阵W、厂进行分块:于是前P-P-11P一1%%1%"p-11

8、-p-1T=€ThT21禺^22_1个变量的维尔克斯统计量(Wilks)Ar为7当增加第p个变量后,〃个变量的维尔克斯统计量(Wilks)A”为,%%=网二叫%PT八T、2^21卩22=A"所以有,Ap-i厂22—丁2几“22-叫统计最[“-汇穿]的极限分布是F((…,―)。川/此F统计量來检验给定前卩-1个变量的条件下,增加笫〃个变量的条件均值是否相等,即是否对区分总体捉供附加信息。三、引入和剔除变量的依据和检验统计量在上述理论基础上,卜•面给出,判别分析屮引入变量和剔除变量的依据和检验方法。(1)假

9、定我们已经计算了/步,并H.已经引入了州,兀2,…勺,现对第/+1步添加一个新变量£的“判别能力”进行检验,为此将变量分为两组,第一组是両/个已经引入的变量,第二组仅有一个变量旺,将这/+1个变量的组内离差阵和总离差阵仍分别记为W与T。1、W12其中,忤(/)二%-叫MJ%二咋-必T=T^trr(D其中,*)讥-為・Tg=Trr-TrlTn-所以维尔克斯统计最A/+1>v(/)A—2_八/.(

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。