欢迎来到天天文库
浏览记录
ID:43394063
大小:1.27 MB
页数:20页
时间:2019-10-01
《判别分析实习》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、判别分析实习—、实验目的1)熟悉判别分析的适用条件和结果验证方法,掌握判别分析的操作及结果阅读。2)能独立判断数据是否符合判别分析的适用条件,能求出相应的判别式,并使用他对新纪录进行分类。重点考察对结果的阅读(领域图、未标化典型判别函数、Bayes判别函数)和使川分析结果对新纪录进行分类。3)结合专业背景知识解释聚类结果。二、判别分析的主要思想1.判别分析的主要思想是:在已知分类类别的基础上,由大量各类样品的观测值,利用判别分析方法建立判别函数,然后利用所建立的判别函数对未知类别的样品进行翔U,使其归入某一已知类别中。2.判别分析是在已知分类的条件下,确定未知对彖归属于哪一个已知
2、分类的一种统计分析方法。它所要解决的问题是对样品的分类问题。因此也是一种常用的分类分析方法。3..特别在地质研究中,山于大量问题需要通过类比的方法来解决,所以该方法在地质工作中应用较广。研究人员经常把已知含矿和已知无矿看作两种类型,通过判别分析,找出两者的最优分界而,对预测区进行预测。三、判别分析和聚类分析的区别:在聚类分析屮,一般人们事先并不知道或并不一定要明确应该分成几类,完全根据数据来确定。根据数据之间的性质,将性质和近的归为一类,将性质差别较人的归入不同的类。而在判别分析屮,其类别是已知的。至少有一个已经明确知道类别的“训练样木”,利用这些数据,就可以建立判别准则,并通过
3、预测变量来为未知类别的观测值进行判别,以确定将其归入已知类别中的哪一类中。四、判别分析的方法判别分析法按判别的组数可分为:两组、多组判别;按区分不同总体所用的数学模型可分为:线性、非线性判别;按所用的方法不同可分为:距离判别、Fisher判别、Bayes判别、逐步判别等。分析方法的思路:根据已知样本f建立判别法则一判别新的样品的归属一、根据距离的判别分析由于已经知道已知样品的所冇点的类别了,所以町以求得每个类型的中心。这样只要定义了如何计算距离,就可以得到任何给定的未知样品到这些已知类别屮心的距离。显然,最简单的办法就是离哪个中心距离最近,就属于哪一类。通常使用的距离是所谓的马氏
4、距离(Mahalanobis距离)。这种根据远近判别的方法,原理简单,直观易懂。二、Fisher准则下的判别分析这是一•种两组、线性的判别。设有A、B两类样品,有p个变量来描述。每个样品可以被看成p维空间上的一个点。A、B两类样詁在数学上就可把它们看作p维空间的两个点群。这两个点群大部分能够区分,但是可能冇一部分相互重叠的。判别分析就是要找出一个包含这P个变量的综合指标,作为划分A与B的界限,使得对于一个新的样品数据,通过这个综合指标的计算,能够判定这个新的样品是归属于A还是B。这个综合指标就叫做判别函数,我们设这个两组线性判别模型的判别函数为:这是p维空间上的一个超平面。具中:
5、cvc2.,Cp为待定系数。从儿何意义上讲,判别分析就是耍在己知不同的两个点群A、B间,寻找一个最优的分割平面,将A、B两点群冇效地区分。Fisher准则下的判别分析就是:要找出这样一个分界面,使得:1、A、B两组的平均值之差最人(即两点群的重心距离最人,两点群的区分最人);2、各组组内离差平方和最小(即点群内部的离散程度最小)o三、Bayes准则下的判别分析Bayes准则K的判别分析多用于多组判别。在Fisher判别中,要求各组变量的平均值有显著差异。而在Bayes准则判别屮所要求的条件较严格,除了要求各纽变量的平均值有显著差异外,还要求各纽变量必须服从多元正态分布;还耍求各组
6、方差•协方差矩阵相等。设有m个组,各组的样品数为nl,n2,・・・nm,总数为n。由p个变量來描述,即每一个样品是由p个变量的观测值所组成,每一个样品可以看作是p维空间上的一个点,每个组的样品可以看作是这个p维空间上一些点组成的点群,则多组样品就是p维空间上的多个点群。Bayes多组判别分析就是用某种规则把p维空间划分为互不相交的m个区域(互不相交的区域是指彼此Z间没有重叠的部分,每个样品点只能属于这多个区域屮的某一个区域,而不能同时落在两个或多个区域屮)。使其错判样品的数Id或犯错谋的平均概率为最小。判定一个未知样品究竞归属于这m个组的哪一个组的方法是计算该样品归属于各组的概率
7、的人小,把它归入概率最大的一组。SPSS对于分为m类的研究对象,建立m个线性判别函数。对于每个个体进行判别吋,把观测量的各变量值代入判别函数,得出判別分数,从1何确定该个体属于哪一类,或计算属于各类的概率,从而判别该个体属于哪一类。四、逐步判别分析逐步判别分析与逐步回归分析的基本思想相似,也是釆川逐步检验的算法,根据每个变量在各组判别式中所起作用的重要性不同,选择判别效果最大的变量进入判别式,同时对那些已经进入判别式的、判别作用变得不再显著的变量,从判别式中剔除出去。每进行一步,
此文档下载收益归作者所有