判别分析(4)逐步判别.ppt

判别分析(4)逐步判别.ppt

ID:48089977

大小:693.50 KB

页数:25页

时间:2020-01-11

判别分析(4)逐步判别.ppt_第1页
判别分析(4)逐步判别.ppt_第2页
判别分析(4)逐步判别.ppt_第3页
判别分析(4)逐步判别.ppt_第4页
判别分析(4)逐步判别.ppt_第5页
资源描述:

《判别分析(4)逐步判别.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、§4.4逐步判别计算方法由上节介绍的贝叶斯准则,我们可以建立多总体的判别函数为显然,在上式 个判别函数的形成中,我们是将个特征变量一次性全部引入各类总体的判别函数中。如此一来,就会导致计算量增大,变量间可能出现相互不独立,方程组阶数太高,以及矩阵奇异等问题。此外,由于不重要变量的引入还可能起反作用,干扰判别效果,经验表明,变量个数的增加并不一定能提高判别效果。因此很重要的一个问题是,如何从多个变量中挑选出若干个对于区分 个总体最有效的变量?这就是逐步判别分析所要解决的问题。§4.4逐步判别计算方法逐步判别与逐步回归的形成思

2、想相似,都采用有进有出的动态调节变量方法,即每一步都通过检验把判别能力最强的一个变量引入判别函数式中。同时也考虑到较早进入判别式的某些变量,其判别能力因其他变量的引入而可能下降,应及时从判别式中剔出,最终在判别式中只保留数量不太多而判别能力又较强的变量。逐步判别分析挑选变量的基本思想与逐步回归一致,所不同的是在逐步回归中剔除或引入变量的标准用的是§4.4逐步判别计算方法变量对回归方程的方差贡献大小来度量,大的引入,小的剔除。而逐步判别分析用的是参加判别式的各变量的组合统计量——Wilks∧值来度量哪些变量可以引入判别方程,

3、哪些变量需从判别方程中剔除?§4.4逐步判别计算方法定义Wilks∧统计量为(4.25)式(4.25)中, , 为已进入判别式的 个变量所构成的组内离差阵与总离差阵。最初计算 , 时,)其中,(4.26)§4.4逐步判别计算方法——称组均值——称总均值事实上式(4.25)的构造思想源于Fisher准则,即要使判别效果明显,组内离差平方和越小越好,两组间离差平方和越大越好。——各总体总样品数§4.4逐步判别计算方法对于式(4.25),一旦原始数据给定 可看成不变,因此只要  越小就说明判别效果越好,也就是 越小,判别效果就越

4、好。为此可考虑用统计量 来度量变量是否重要。§4.4逐步判别计算方法§4.4.1判别函数中变量引人过程形成思想由式(4.21)可知,不妨设 次迭代该判别式中已引入 个变量,此时我们总可以由式(4.25)计算出相应 个变量的Wilks∧统计值,记为 ,此时在判别式外,还有  个变量未引入判别式,于是我们总可以在剩下的个变量中用穷举的方法,让  个变量中的每一个变量与已进入方程的 个变量配对构成  个变量的判别方程,用数学式子来说明问题,即将  简记为(4.29)其中 , ,…, 表示已进入方程中的 个变量,显然未进入方程组的

5、变量为  ,记为    。为了讨论方便,这里假设变量是按自然顺序选中的,即第 步恰好选中 ,这并不失去一般性,因为把变量顺序重新编排总能保证这一点。按照穷举法,分别将      引入式(4.29),并计算出相应的+1个变量的Wilks∧统计值,记为       。§4.4.1判别函数中变量引人过程形成思想显然只需选择         与比较。如果则说明该变量  引入判别方程后,判别效果有了改善,反之不能引入。但是用   进行计算很复杂,于是我们给出一种便于计算,又与 等效的另一个统计量  的简化式,来衡量变量的的重要性[4

6、]。可以证明化简后有(4.30)§4.4.1判别函数中变量引人过程形成思想式中,——表示通过S次迭代后W阵在行列的元素;——表示通过S次迭代后 阵在 行 列的元素。在开始时,首先考虑引入,为此需要计算所有变量       所对应的,选取           进入方程,不妨设   能否最后进入方程,还需要与引入门坎值比较,为了确定引入门坎值标准,可用如下§4.4.1判别函数中变量引人过程形成思想统计量[5]:(4.31)对于给定水平 ,查F分布表可得门坎值,如果   ,则认为变量 重要,可以引入方程,否则变量不能引入方程。§

7、4.4.1判别函数中变量引人过程形成思想§4.4.2判别函数中变量的剔除过程形成思想设通过S次迭代,判别函数中已引入 个变量,为其对应的Wilks∧统计值可算出为 ,现在考虑剔除。由于在判别函数中每次只能剔除一个变量,到底首先应剔除变量中哪一个呢?我们还是在     中使用穷举的方法,为讨论方便,这里假设变量是按自然顺序考虑剔除,不妨首先考虑在判别函数式(4.29)中剔除 ,此时判别函数记为由此式可算出  个变量的Wilks∧统计值记为  ,如果说明 可以从判别函数中考虑剔除,否则不能剔除。同理剔除,此时判别函数应为(),

8、由此式可算出个变量的Wilks∧统计值记为,如果,说明可以从判别函数中考虑剔除,否则不能。§4.4.2判别函数中变量的剔除过程形成思想除上述情形之外,如果对所有的变量都有到底首先该剔除中的哪一个呢?一般我们选择的最大者所对应的变量作为剔除对象。然而用穷举的方法来判断方程中哪一个变量应该被剔除本身是一个复

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。