判别分析中的变量择优及其matlab实现

判别分析中的变量择优及其matlab实现

ID:5353198

大小:166.46 KB

页数:5页

时间:2017-12-08

判别分析中的变量择优及其matlab实现_第1页
判别分析中的变量择优及其matlab实现_第2页
判别分析中的变量择优及其matlab实现_第3页
判别分析中的变量择优及其matlab实现_第4页
判别分析中的变量择优及其matlab实现_第5页
资源描述:

《判别分析中的变量择优及其matlab实现》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第32卷第1期河南师范大学学报(自然科学版)Vol.32No.12004年3月JournalofHenanNormalUniversity(NaturalScience)Mar.2004文章编号:1000-2367(2004)01-0012-05y判别分析中的变量择优及其MATLAB实现1221陈辉,胡英,王绪本,郭科(1.成都理工大学信息管理学院,四川成都610059;2.成都理工大学信息工程学院)摘要:介绍判别分析的基本思想,对判别分析中特征变量的择优进行了系统的论述,重点阐述逐步判别的变量择优和基于总体可分性的变量择优.以MATLAB语言为工具,结合实例对自编逐步判别函数W

2、isestep与MAT-LAB中自带的判别分析函数Classify进行了比较,从而表明了变量择优的重要性.关键词:判别分析;逐步判别;变量择优;Classify函数中图分类号:O212文献标识码:A近年来,随着定量科学的深入发展及其在自然科学、社会科学及经济管理科学中的广泛应用,统计分析[1]的实践价值就显得尤为重要.作为统计分析的一种重要方法—判别分析,被用于判别个体所属群体.我们给出判别分析的一般提法:设有k个总体G1、G2、G3⋯Gk,已知待测样品X来自k个总体中的某一个,但不知X究竟来自其中的哪一个.判别分析就是要根据对k个总体的已知知识和对待判样品X的某些特征指标值,去

3、判断样品X应归于哪一个总体.即判别分析就是根据不同类别所提取的特征变量来定量的建立待判样品归属于哪个已知总体的数学模型.从以上分析可以看出,要对待判样品做出正确的归类,首先要已知总体及待判样品的特征变量,从而对总体及待判样品事物的特性进行变量指标的描述,进而判别待判样品的归属.由此可知,特征变量是判别分析中的一个重要问题,变量选择是否恰当,是判别效果优劣的关键:(1)如果在某个判别问题中,将其中主要的指标忽略了,由此建立的判别函数其效果一定不好;(2)在判别分析中,不是特征变量愈多愈好.如果特征变量的个数较多,这样建立的判别函数需要大量的计算,再者,因为特征变量之间的不独立性及判

4、别方程组的阶数太高,可能导致计算精度下降,甚至出现病态.基于此,我们给出了以下特征变量择优算法.1判别分析中的变量择优方法1.1前进法变量择优先在p个变量中选择一个判别能力最强的变量i1,然后在剩余的p-1个变量中再选取一个变量i2,使在扣除i1提供的信息外,变量i2对k个总体的区分可以提供最大的附加信息.然后,再在剩余的p-2个变量中选一个i3,它是除i1,i2外可对k个总体区别提供最大附加信息的变量.如此下去,直至剩余的所有变量都不能再提供附加信息,则选择工作终止.1.2后退法变量择优该方法与前进法变量择优正好相反.首先,取p个变量均为特征变量,然后,选择一个判别效率最低的变

5、量i1,把它剔除.接着,在剩下的p-1个变量中,再剔除一个判别效率最低的变量.如此下去,直至剩余的所有变量均能对k个总体的判别提供较强的附加信息时,筛选工作终止.1.3逐步判别法变量择优y收稿日期:2003-10-10基金项目:国家自然科学基金资助项目(40074036)作者简介:陈辉(1981~),男,江苏徐州人,成都理工大学硕士研究生,研究方向:数字优化计算与统计分析.第1期陈辉等:判别分析中的变量择优及其MATLAB实现131.3.1逐步判别分析的引入在上述两种方法中,被选取的变量,将一直属于被选特征变量的集合,而被剔除的变量,将永远被排除在被选特征变量集合之外.逐步判别法

6、则是采用有进有出的算法,即每一步都要对变量的附加信息进行检验,使其优胜劣汰.它的原理是先将判别能力最强的变量引入判别方程,在接下来引入变量的过程中,先前引入的变量,随着其他变量的引入,其显著性可能有所降低,若其判别能力变弱,则要从所选的集合中剔除.总之,[2]被选变量的集合总是保留最强判别能力的特征变量.这里对变量的判别能力用Wilks-□统计量加以描述.[3]1.3.2逐步判别分析的步骤(1)特征变量的引入在特征变量的引入和剔除过程中,每次只引入或剔除一个特征变量.设经S次迭代判别函数式已引入r个变量,据式(1)计算出相应r个变量的Wilks-□统计值记为Kr,此时剩余m-r个

7、变量未引入判别式,于是我们总可以在剩下的m-r个变量中用穷举法,让m-r个变量中一个变量与已经进入的r个变量构成r+1个变量的判别函数,此函数为:Fk(x)=C1kx1+C2kx2+⋯+Crkxr,k=1,2,⋯,g(1)其中x1,x2,⋯,xr表示已进入方程中的r个变量,未进入的变量记为xr+1,xr+2,⋯,xm.(1)(2)(m-r)将xr+1,xr+2,⋯,xm引入(1)式,并计算出相应的Wilks-□统计值,记为Kr+1,Kr+1,⋯,Kr+1.显然只需选(1)(2)(

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。