多元统计分析判别分析讲义

多元统计分析判别分析讲义

ID:6825393

大小:1.88 MB

页数:25页

时间:2018-01-27

多元统计分析判别分析讲义_第1页
多元统计分析判别分析讲义_第2页
多元统计分析判别分析讲义_第3页
多元统计分析判别分析讲义_第4页
多元统计分析判别分析讲义_第5页
资源描述:

《多元统计分析判别分析讲义》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、注意电子文档使用范围EquationChapter1Section1《多元统计分析》MultivariateStatisticalAnalysis主讲:统计学院统计学院应用统计学教研室SchoolofStatistics24第页第三章判别分析【教学目的】1.让学生了解判别分析的背景、基本思想;2.掌握判别分析的基本原理与方法;3.掌握判别分析的操作步骤和基本过程;4.学会应用聚类分析解决实际问题。【教学重点】1.注意判别分析与聚类分析的关系(联系与区别);2.阐述各种判别分析方法。§1概述一、什么是判别分析1.研究背景科学研究中,经常会遇到这样的问题:某研究对象以某种方

2、式(如先前的结果或经验)已划分成若干类型,而每一类型都是用一些指标来表征的,即不同类型的的观测值在某种意义上有一定的差异。当得到一个新样本观测值(或个体)的关于指标的观测值时,要判断该样本观测值(或个体)属于这几个已知类型中的哪一个,这类问题通常称为判别分析。也就是说,判别分析(discriminantanalysis)是根据所研究个体的某些指标的观测值来推断该个体所属类型的一种统计方法。判别分析的应用十分广泛。例如,在工业生产中,要根据某种产品的一些非破坏性测量指标判别产品的质量等级;在经济分析中,根据人均国民收入,人均工农业产值,人均消费水平等指标判断一个国家的经济

3、发展程度;在考古研究中,根据挖掘的古人头盖骨的容量,周长等判断此人的性别;在地质勘探中,根据某地的地质结构,化探和物探等各项指标来判断该地的矿化类型;在医学诊断中,医生要根据某病人的化验结果和病情征兆判断病人患哪一种疾病,等等。值得注意的是,作为一种统计方法,判别分析所处理的问题一般都是机理不甚清楚或者基本不了解的复杂问题,如果样本观测值的某些观测指标和其所属类型有必然的逻辑关系,也就没有必要应用判别分析方法了。2.基本思想及意义用统计的语言来描述判别分析,就是已知有个总体(每个总体可认为是属于的指标取值的全体),它们的分布函数均为p维函数,对于任一给定的新样本观测值关

4、于指标的观测值,我们要判断该样本观测值应属于这g个总体中的哪一个。在实际应用中,通常由取自各总体的关于指标的样本为该总体的代表,该样本称为训练样本。判别分析即提取训练样本中各总体的信息以构造一定的准则来决定新样本观测值的归属问题。训练样本往往是历史上对某现象长期观测或者是用昂贵的试验手段得到的,因此对当前的新样本观测值,我们自然希望将其指标值中的信息同各总体训练样本中的信息作比较,使可在一定程度上判定新样本观测值的所属类型。概括起来,下述几个方面体现了判别分析的重要意义。第一,为未来的决策和行动提供参考。例如,以前对一些公司在破产前两年观测到某些重要的金融指标值。现在,

5、要根据另一个同类型公司的这些指标的观测值,预测该公司两年后是否将濒临破产的危险,这便是一种判别,其结论可以帮助该公司决策人员及早采取措施,防止将来可能破产的结局。24第页第二,避免破产的破坏。例如,一只灯泡的寿命只有将它用坏时才能得知;一种材料的强度只有将它压坏时才能获得。一般地,我们希望根据一些非破坏性的测量指标,便可将产品分出质量等级,这也要用到判别分析。第三,减少获得直接分类信息的昂贵代价。例如在医学诊断中,一些疾病可用代价昂贵的化验和手术得到确诊,但通常人们往往更希望通过便于观测(从而也可能导致误诊)的一些外部症状来诊断,以避免过大的开支和对患有不必要的损伤。第

6、四,在直接分类信息不能获得的情况下可用判别分析。例如,要判断某未署名的文学作品是否出自某已故作家之手,很显然,我们不能直接去问他。这时可以用这位已故作家署名作品的写作特点(用一些变量描述)为训练样本,用判别分析方法在一定程度上判定该未署名作品是否由该作家所作。从以上例子也可以清楚地看到,如果不是利用直接明确的分类信息来判断某样本观测值的归属问题,难免会出现误判的情况。判别分析的任务是依据训练样本所提供的信息,建立在某种意义下最优(如误判概率最小,或误判损失最小等)的准则来判定一个新样本属于哪一个总体。根据判别准则的不同,我们主要介绍距离判别、Fisher判别和Bayes

7、判别。一、判别分析的分类及准则1.分类(1)按照判别组数分:两组判别和多组判别;(2)按照所用的数学模型分:线性判别和非线性判别;(3)按照处理度量的方法分:逐步判别和序贯判别。2.准则主要有:马氏距离最小准则,Fisher准则,平均损失最小准则,最小平方准则,最大似然准则,最大概率准则。并可由此提出判别方法:距离判别法,Fisher判别法,Bayes判别法,逐步判别法。二、判别分析与聚类分析判别分析是用以判别个体所属群体的一种统计分析方法,产生于20世纪30年代。判别分析是在已知研究对象分成若干类型(或组别)并已取得各种类型的一批已知样

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。