《判别分析》课件

《判别分析》课件

ID:38688367

大小:3.08 MB

页数:101页

时间:2019-06-17

《判别分析》课件_第1页
《判别分析》课件_第2页
《判别分析》课件_第3页
《判别分析》课件_第4页
《判别分析》课件_第5页
资源描述:

《《判别分析》课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、1第四章判别分析第一节引言第二节距离判别法第三节贝叶斯(Bayes)判别法第四节费歇(Fisher)判别法第五节实例分析与计算机实现2第四节费歇(Fisher)判别法一Fisher判别的基本思想二Fisher判别函数的构造三线性判别函数的求法3Fisher判别法是1936年提出来的,该方法的主要思想是通过将多维数据投影到某个方向上,投影的原则是将总体与总体之间尽可能的分开,然后再选择合适的判别规则,将新的样品进行分类判别。右图中有A、B两个总体。在原始变量(指标)X1、X2的方向上,A、B都有很大的重叠,难以区分清楚。但是,如果以X1、X2为横、纵坐标轴构建一个平面,若能设法找到

2、一个y轴,使得当X1X2平面上的散点投射到y轴上时,两组观察值的重叠程度最小,则综合指标y的区分能力显然大于原先的X1、X2。yx2x1一、Fisher判别的基本思想4一、Fisher判别的基本思想5一、Fisher判别的基本思想6二、Fisher判别函数的构造1、针对两个总体的情形71、针对两个总体的情形82、针对多个总体的情形92、针对多个总体的情形1011三、线性判别函数的求法12131415161718一般需要多少个判别式就够用了?19另外一种求4.23式的思路*20另外一种求4.23式的思路*21需要指出是,此处利用极值原理求极值时,只给出了必要条件的数学推导,而省略了

3、有关充分条件的论证,因为在实际问题中,往往根据问题本身的性质就能肯定有最大值(或最小值),如果所求的驻点只有一个,这时就不需要根据极值存在的充分条件判定它是极大还是极小,而是直接能肯定这唯一的驻点就是所求的最大值(或最小值)。为了避免较多的数学推导,这里不追求数学上的完整性。另外一种求4.23式的思路*22总体参数未知情况下的解决方法232425判别规则26判别规则27判别函数U(X)的另一种形式28例题4.5经典案例:费希尔于1936年发表的鸢尾花(Iris)数据,被广泛用为判别分析的例子。数据是对3种鸢尾花:刚毛鸢尾花(第一组)、变色鸢尾花(第二组)和弗吉尼亚鸢尾花(第三组)

4、,各自抽取一个容量为50的样本,测量其花萼长度x1、花萼宽度x2、花瓣长度x3、花瓣宽度x4,单位为mm。2930313233求解特征值与特征向量34求判别函数35最后,确定判别规则36最后,确定判别规则37本例题SPSS的几个关键输出结果特征值38中心化的Fisher判别函数U1(X)和U2(X)的取值:39各判别函数的组均值为:4041几种判别方法的关系*Fisher判别与距离判别对判别变量的分布并无要求,而贝叶斯判别要求了解判别变量的先验分布,因此,Fisher判别核距离判别相对于贝叶斯判别,较为简单实用;当然,后者更加精确。当k=2且两个总体协差阵相等时,Fisher判别

5、与距离判别是等价的。当判别变量服从正态分布,且不考虑误判代价时,它们与贝叶斯判别也是相同的。42第五节实例分析与计算机实现这一节我们利用SPSS对Fisher判别法和Bayes判别法进行计算机实现。例题4.6:为研究某地区人口死亡状况,已按某种方法将15个已知地区样品分为3类,指标含义及原始数据如下。试建立判别函数,并判定另外4个待判地区属于哪类?(本例SPSS数据文件:4-6.sav)X1:0岁组死亡概率X4:55岁组死亡概率X2:1岁组死亡概率X5:80岁组死亡概率X3:10岁组死亡概率X6:平均预期寿命43表4.1各地区死亡概率表44分类变量Group取值的设置45开始判别

6、分析46(一)操作步骤1.在SPSS窗口中选择Analyze→Classify→Discriminate,调出判别分析主界面,将左边的变量列表中的“group”变量选入分组变量中,将X1至X6变量选入自变量中,并选择Enterindependentstogether单选按钮,即使用所有自变量进行判别分析。472.点击DefineRange按钮,定义分组变量的取值范围。本例中分类变量的范围为1到3,所以在最小值和最大值中分别输入1和3。单击Continue按钮,返回主界面。483.单击Statistics…按钮,指定输出的描述统计量和判别函数系数。选中FunctionCoeffic

7、ients栏中的Fisher’s和Unstandardized。然后,单击Continue按钮,返回主界面。49这两个选项的含义如下:Fisher’s:给出Bayes判别函数的系数。(注意:这个选项不是要给出Fisher判别函数的系数。这个复选框的名字之所以为Fisher’s,是因为按判别函数值最大的一组进行归类这种思想是由Fisher提出来的。这里极易混淆,请同学注意。)Unstandardized:给出未标准化的Fisher判别函数(即典型判别函数,也即我们前面讲过的“中心化

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。